سفارش تبلیغ
صبا ویژن

سایت سرگرمی و خوش گذرونی

آیا می دانید متن کاوی چیست ؟

    نظر

ما هر روزه با زبانِ فارسی با هم گفت‌و‌گو می‌کنیم. انگلیسی‌ها هم با زبانِ انگلیسی با یکدیگر صحبت می‌کنند. به این صورت است که زبان، ابزاری برای ارتباط با همنوعان در‌آمده است. به این زبان، زبانِ طبیعی (Natural Language) می‌گویند و مشکلِ اصلیِ آن (از نگاهِ کامپیوتر) این است که کامپیوتر به صورت پیش‌فرض فقط 0ها و 1ها را می‌فهمد. یعنی یک کامپیوتر نمی‌تواند زبانِ طبیعیِ محاوره‌ایِ ما را متوجه شود. برای همین نیاز است تا یک مجموعه عملیات (Processes) بر روی این زبان طبیعی انجام شود (Natural Language Processing یا همان NLP) تا بتوان آن را برای کامپیوتر قابل فهم کرد. بعد از آن می‌توان از قدرتِ کامیپوتر در محاسبات و یادگیری ماشین استفاده کنیم تا اطلاعاتِ ارزشمندی را از میان این داده‌ها استخراج کنیم.

برای درکِ بهتر، وب‌سایت اخبار گوگل را ببینید. در این وب‌سایت، اخبارِ روزانه که از منابعِ خبریِ مختلف جمع‌آوری و به صورت دسته‌بندی شده بر اساس اولویت و اهمیت رده‌بندی می‌شوند. برای مثال برخی از اخبار، ورزشی هستند و برخی دیگر سیاسی. گوگل برای این‌که بتواند این دسته‌بندی همراه با اهمیتِ هر خبر را تشخیص دهد، می‌توانست چند صد اپراتور (انسان) را استخدام نماید و این کار را به صورت دستی انجام دهد. اما با کمک الگوریتم‌های مبتنی بر متن و متن‌کاوی، گوگل متن‌های خبری را به کامپیوتر می‌دهد و کامپیوتر بعد از انجام عملیاتِ پردازش و آنالیزِ متن، برای مثال می‌تواند بفهمد که یک خبر ورزشی است یا سیاسی یا اقتصادی! و بعد با کمکِ همین درک از متن، دسته‌بندیِ مختلفی بر روی این اخبار انجام دهد. همچنین با کمک الگوریتم‌های آنالیز متن و آنالیز گراف، می‌تواند اهمیتِ این یک خیر را درک کرده و اخبار با اهمیت بیشتر را بالاتر نمایش دهد.

  

مثالِ بالا یک نمونه از کاربردهای پردازشِ متن بود. پردازشِ متن و متن‌کاوی (Text Mining) در کنار الگوریتم‌های یادگیریِ ماشین و داده‌کاوی می‌تواند منجر به خروجی‌های مفیدی شود. برای مثال ترجمه‌ی خودکار متون، ساختن ربات خودکار جهت تعامل با کاربر، تشخیص تقلب در پایان‌نامه‌ها و… از کاربردهای مختلف حوزه‌ی متن‌کاوی و آنالیز متن می‌باشد. در ادامه‌ی این دوره با مراحل و روش‌های مختلفِ آن‌ها آشنا خواهیم شد.

 

منبع : https://chistio.ir/متن-کاوی-text-mining-پردازش-زبان-طبیعی-nlp-چیست/