آیا می دانید متن کاوی چیست ؟
ما هر روزه با زبانِ فارسی با هم گفتوگو میکنیم. انگلیسیها هم با زبانِ انگلیسی با یکدیگر صحبت میکنند. به این صورت است که زبان، ابزاری برای ارتباط با همنوعان درآمده است. به این زبان، زبانِ طبیعی (Natural Language) میگویند و مشکلِ اصلیِ آن (از نگاهِ کامپیوتر) این است که کامپیوتر به صورت پیشفرض فقط 0ها و 1ها را میفهمد. یعنی یک کامپیوتر نمیتواند زبانِ طبیعیِ محاورهایِ ما را متوجه شود. برای همین نیاز است تا یک مجموعه عملیات (Processes) بر روی این زبان طبیعی انجام شود (Natural Language Processing یا همان NLP) تا بتوان آن را برای کامپیوتر قابل فهم کرد. بعد از آن میتوان از قدرتِ کامیپوتر در محاسبات و یادگیری ماشین استفاده کنیم تا اطلاعاتِ ارزشمندی را از میان این دادهها استخراج کنیم.
برای درکِ بهتر، وبسایت اخبار گوگل را ببینید. در این وبسایت، اخبارِ روزانه که از منابعِ خبریِ مختلف جمعآوری و به صورت دستهبندی شده بر اساس اولویت و اهمیت ردهبندی میشوند. برای مثال برخی از اخبار، ورزشی هستند و برخی دیگر سیاسی. گوگل برای اینکه بتواند این دستهبندی همراه با اهمیتِ هر خبر را تشخیص دهد، میتوانست چند صد اپراتور (انسان) را استخدام نماید و این کار را به صورت دستی انجام دهد. اما با کمک الگوریتمهای مبتنی بر متن و متنکاوی، گوگل متنهای خبری را به کامپیوتر میدهد و کامپیوتر بعد از انجام عملیاتِ پردازش و آنالیزِ متن، برای مثال میتواند بفهمد که یک خبر ورزشی است یا سیاسی یا اقتصادی! و بعد با کمکِ همین درک از متن، دستهبندیِ مختلفی بر روی این اخبار انجام دهد. همچنین با کمک الگوریتمهای آنالیز متن و آنالیز گراف، میتواند اهمیتِ این یک خیر را درک کرده و اخبار با اهمیت بیشتر را بالاتر نمایش دهد.
مثالِ بالا یک نمونه از کاربردهای پردازشِ متن بود. پردازشِ متن و متنکاوی (Text Mining) در کنار الگوریتمهای یادگیریِ ماشین و دادهکاوی میتواند منجر به خروجیهای مفیدی شود. برای مثال ترجمهی خودکار متون، ساختن ربات خودکار جهت تعامل با کاربر، تشخیص تقلب در پایاننامهها و… از کاربردهای مختلف حوزهی متنکاوی و آنالیز متن میباشد. در ادامهی این دوره با مراحل و روشهای مختلفِ آنها آشنا خواهیم شد.
منبع : https://chistio.ir/متن-کاوی-text-mining-پردازش-زبان-طبیعی-nlp-چیست/