Ana gezinime geç Aramaya geç Ana içeriğe geç

Analysis of preprocessing methods on classification of Turkish texts

  • Dilara Torunoǧlu*
  • , Erhan Çakirman
  • , Murat Can Ganiz
  • , Selim Akyokuş
  • , M. Zahid Gürbüz
  • *Bu çalışma için yazışmadan sorumlu yazar

Araştırma sonucu: Kitap/Rapor/Konferans Bildirisinde BölümKonferans katkısıbilirkişi

49 Atıf (Scopus)

Özet

Preprocessing is an important task and critical step in information retrieval and text mining. The objective of this study is to analyze the effect of preprocessing methods in text classification on Turkish texts. We compiled two large datasets from Turkish newspapers using a crawler. On these compiled data sets and using two additional datasets, we perform a detailed analysis of preprocessing methods such as stemming, stopword filtering and word weighting for Turkish text classification on several different Turkish datasets. We report the results of extensive experiments.

Orijinal dilİngilizce
Ana bilgisayar yayını başlığıINISTA 2011 - 2011 International Symposium on INnovations in Intelligent SysTems and Applications
Sayfalar112-117
Sayfa sayısı6
DOI'lar
Yayın durumuYayınlandı - 2011
Harici olarak yayınlandıEvet
Etkinlik2011 International Symposium on INnovations in Intelligent SysTems and Applications, INISTA 2011 - Istanbul-Kadikoy, Turkey
Süre: 15 Haz 201118 Haz 2011

Yayın serisi

AdıINISTA 2011 - 2011 International Symposium on INnovations in Intelligent SysTems and Applications

???event.eventtypes.event.conference???

???event.eventtypes.event.conference???2011 International Symposium on INnovations in Intelligent SysTems and Applications, INISTA 2011
Ülke/BölgeTurkey
ŞehirIstanbul-Kadikoy
Periyot15/06/1118/06/11

Parmak izi

Analysis of preprocessing methods on classification of Turkish texts' araştırma başlıklarına git. Birlikte benzersiz bir parmak izi oluştururlar.

Alıntı Yap