Veri madenciliğiânde yapısal olmayan verinin analizi: Metin ve web madenciliği
Year 2009,
Volume: 2 Issue: 2, 48 - 58, 01.06.2009
M.Ö. Dolgun
T.G. Özdemir
D. Oğuz
References
- Chakrabarti, S. (2003), Mining the Web: Discovering Knowledge from Hypertext Data, Morgan Kaufmann Publishers, San Francisco.
- Dolgun, M.Ö. (2006), Büyük Al $veri$ Merkezleri Kçin Veri Madencili i Uygulamalar , Yüksek Lisans Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü, Ankara.
- Han, J., Kamber, M. (2001), Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, San Francisco.
- Hearst, M. (2009), What is text mining, http://www.sims.berkeley.edu/~hearst/textmining.html.
- Introduction to Text Mining (2008), SPSS Inc.
- Liu, B. (2007), Web Data Mining: Exploring Hyperlinks, Contents and Usage Data, Springer.
- Özdemir Güzel, T., Dolgun, M.Ö., Pat r, U., Delilo lu, S., Korkmaz, H.E. (2007), 2005 Y l Ö renci Seçme S nav (ÖSS) Verileri Kullan larak Ö renci Profilinin Belirlenmesi, 5. +statistik Kongresi, Antalya.
- Shapiro-Piatetsky, G., Steingold, S. (2000), Measuring Lift Quality in Database Marketing, ACM SIGKDD Explorations Newsletter, 2(2), 76-80.
- Sholom M.W., Indurkhya N., Zhang T., Damerau F. (2004), Text Mining: Predictive Methods for Analyzing Unstructured Information, Springer.
- Tan, A.H., Yu, P.S. (2004), Guest Editorial: Text and Web Mining, Applied Intelligence 18, 239-241, Kluwer Academic Publisher.
- Unstructured data (2009), http://en.wikipedia.org/wiki/Unstructured_data.
- W. Fan, L. Wallace, S. Rich, Z. Zhang. (2006), Tapping into the power of text mining, Communications of ACM, 49(9), 76-82.
- Web Mining for Clementine 12.0 User’s Guide (2007), SPSS Inc.
Veri madenciliğiânde yapısal olmayan verinin analizi: Metin ve web madenciliği
Year 2009,
Volume: 2 Issue: 2, 48 - 58, 01.06.2009
M.Ö. Dolgun
T.G. Özdemir
D. Oğuz
Abstract
Verinin büyük boyutlara ula$mas ve bilgisayar donan mlar n n bu büyük boyuttaki veriyi depolayarak yüksek kapasitede analiz yapabilecek seviyelere gelmeleri ile birlikte analistler karma$ k ko$ullar ile kar$ kar$ ya kalmaktad rlar. Bu karma$ k ko$ullar n ço u yap sal olmayan verinin etkin bir $ekilde saklanmas ve analizi ile ili$kilidir. Merrill Lynch, potansiyel olarak kullan lan bütün verilerin yakla$ k %80’inin yap sal olmayan türde oldu unu ifade etmi$tir. Bu büyük ve karma$ k yap daki yap sal olmayan veri analistlere yeni f rsatlar açmaktad r. Bu çal $mada, yap sal olmayan verinin metin ve web madencili i yöntemleri ile yap sal hale dönü$türülmesi sonucu modele dahil edilmesinin, model ba$ar s na yapaca katk analiz edilmi$tir. Karar a ac yöntemlerinden C5.0 algoritmas kullan larak elde edilen modeller birbirleri ile kar$ la$t r lm $ ve en iyi model tespit edilmi$tir
References
- Chakrabarti, S. (2003), Mining the Web: Discovering Knowledge from Hypertext Data, Morgan Kaufmann Publishers, San Francisco.
- Dolgun, M.Ö. (2006), Büyük Al $veri$ Merkezleri Kçin Veri Madencili i Uygulamalar , Yüksek Lisans Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü, Ankara.
- Han, J., Kamber, M. (2001), Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, San Francisco.
- Hearst, M. (2009), What is text mining, http://www.sims.berkeley.edu/~hearst/textmining.html.
- Introduction to Text Mining (2008), SPSS Inc.
- Liu, B. (2007), Web Data Mining: Exploring Hyperlinks, Contents and Usage Data, Springer.
- Özdemir Güzel, T., Dolgun, M.Ö., Pat r, U., Delilo lu, S., Korkmaz, H.E. (2007), 2005 Y l Ö renci Seçme S nav (ÖSS) Verileri Kullan larak Ö renci Profilinin Belirlenmesi, 5. +statistik Kongresi, Antalya.
- Shapiro-Piatetsky, G., Steingold, S. (2000), Measuring Lift Quality in Database Marketing, ACM SIGKDD Explorations Newsletter, 2(2), 76-80.
- Sholom M.W., Indurkhya N., Zhang T., Damerau F. (2004), Text Mining: Predictive Methods for Analyzing Unstructured Information, Springer.
- Tan, A.H., Yu, P.S. (2004), Guest Editorial: Text and Web Mining, Applied Intelligence 18, 239-241, Kluwer Academic Publisher.
- Unstructured data (2009), http://en.wikipedia.org/wiki/Unstructured_data.
- W. Fan, L. Wallace, S. Rich, Z. Zhang. (2006), Tapping into the power of text mining, Communications of ACM, 49(9), 76-82.
- Web Mining for Clementine 12.0 User’s Guide (2007), SPSS Inc.