Bilgi yüklemesi problemini çözmeye çalışır. Veri madenciliğine benzer şekilde veri kaynaklarından yararlı bilgi
elde etmeyi amaçlar. Farkı, veri kaynaklarının dokümanlardan oluşmasıdır.
Feldman R., Sanger J., "THE TEXT MINING HANDBOOK
Advanced Approaches in Analyzing Unstructured Data", Cambridge
University Press, 2007.
(1) Sınıflandırma: Verilen sınıflar kullanılarak her
dokümanın ait olduğu sınıf/sınıflar bulunur.
(2) Kümeleme: Sınıflandırmadan farklı olarak sınıflar da
otomatik oluşturulur.
(3) Eğilim Analizi: Konuların zaman içindeki eğilimleri tespit edilir.
Montes-y-Gómez M., Gelbukh A., López-López A., "Mining the news:
trends, associations, and deviations", 2001.
Yazılı veya sözlü doğal dili araştıran sistemlerin mühendisliğidir.
Bir doğal dil işlemcisi, insan dilini anlar. "Anlamak", bilgisayarın insan dili girdisini
kabul etmesi ve gerekli bilgi işlem görevlerini gerçekleştirmesi anlamına gelir.
Çakıroğlu Ü., "Data Modelling by Using Semantic Networks and Frames",
e-Journal of New World Sciences Academy Engineering Sciences, 2010.
Ortaya çıktığından beri Yapay Zeka'daki en önemli araştırma alanlarından biri olmuştur.
Öğrenme açısından, bilgi ve karşılaşılan sorunların karmaşıklığı ve çeşitliliği nedeniyle
çözülmesi en zor olanlardan biri olarak kabul edilmektedir.
Collier R., "An Historical Overview of Natural Language Processing Systems that Learn",
Artificial Intelligence Review, 1994.