Bilgisayar teknolojisinde günümüzün sihirli terimi BIG DATA. Büyük veri yığınlarından anlamlı bilgiler, ilişkiler ve istatistikler çıkartmanın en zor yolu, verilerin dağınık düzensiz oluşu. Sayısal verileri düzene sokmak çok daha kolayken verilerin metin olması işleri kat kat zorlaştıran bir unsur. Teknolojinin de gelişmesiyle birlikte kullanılan yapısal olmayan veri miktarı giderek artıyor. Yapısal olmayan veriden bilgi keşfi olarak da tanımlanan “metin madenciliği” yöntemleri veri analizinde doğal dil işleme teknikleri sayesinde başarılı sonuçlar veriyor.
Veri kaynaklarında bulunan ve genelde göz ardı edilen yapısal olmayan verinin analizi metin madenciliği yöntemleri ile hızlı ve etkin bir biçimde yapılabiliyor. Metin madenciliği süreci; dokümanların toplanması ve aynı formatta tutularak standartlaştırılması, metnin önişleme sürecinden geçirilerek yapısal veriye dönüştürülmesi olarak özetlenebilir. Tabii bu aşamada doğal dil işleme tekniklerinin devreye girmesi kaçınılmaz. Çünkü metinlerin, cümlelerin, kelimelerin hangi anlama geldiğini, bağlama göre nasıl değiştiğini belirlemek için ileri düzey doğal dil işleme teknikleri kullanılıyor. SAS Enterprise Miner ile Veri Madenciliğine Giriş, bütün bu konuları herkesin anlayabileceği bir dilde örneklerle ele alıyor. Daha da önemlisi, Enterprise Miner yazılımının Türkçe dil desteği sayesinde bütün uygulamaların ve işlemlerin Türkçe üzerinde örneklendirilebilmesi.
• Metin Madenciliği • Türkçe Dilbilimsel Analiz• Metin Madenciliği ile Önişleme Teknikleri
• Metin Madenciliği Yöntemleri • Metin Sınıflama • Metin Kümeleme• Bilgi Çıkarımı
• SAS Enterprise Miner ile Metin Madencilği• İşlemciler• Uygulamada Kullanılan Modeller
• Modelleme Sonuçları ve Karşılaştırılması • NACE Faaliyet Sınıflaması Üzerine Bir Uygulama