Önerici sistem
Önerici sistemler ya da tavsiye sistemleri (bazı yerlerde 'sistem' yerine 'platform' ya da 'motor' kullanılır) bir kullanıcının bir öğeye vereceği 'değerlendirme' ya da 'tercih' miktarının öngörülmesini hedefleyen bilgi filtreleme sistemleridir.[1][2]
Önerici sistemler son yıllarda fazlaca yaygınlaşmış ve birçok farklı uygulamada kullanılmıştır. En popüler uygulamaları filmler, müzikler, haberler, kitaplar, bilimsel makaleler, arama sorguları, sosyal medya etiketleri ve genel anlamda ürünler üzerine yapılmıştır.
Genel bakış
Önerici sistemler iki farklı yöntemden birini kullanarak bir öneriler listesi üretir – işbirlikçi filtreleme ya da içerik-bazlı filtreleme.[3] İşbirlikçi filtreleme yaklaşımları kullanıcının geçmiş davranışları (geçmişte satın alınan ya da seçilen ya da değerlendirme yapılan öğeler) ile birlikte diğer kullanıcıların yaptığı benzer kararları kullanarak bir model oluşturur. Bu model daha sonra kullanıcının ilgisini çekebilecek öğelerin öngörülmesi için kullanılır.[4] İçerik-bazlı filtreleme yaklaşımları ise öğelerin bir dizi karakteristiğinden yola çıkarak benzer karakteristiklere sahip diğer öğeleri önerir.[5] Bu iki yaklaşım sıklıkla bir arada kullanılır (bkz. Hibrit Önerici Sistemler).
İşbirlikçi ve içerik-bazlı filtreleme sistemleri arasındaki farklar iki popüler müzik önerme sisteminin karşılaştırmasıyla gösterilebilir – Last.fm ve Pandora Radyo.
- Last.fm, kullanıcının düzenli olarak dinlediği parçaları gözlemler ve bunları diğer kullanıcıların dinleme alışkanlıklarıyla karşılaştırarak bir önerilen şarkılar radyosu oluşturur. Kullanıcının kütüphanesinde yer almayan ama benzer zevklere sahip diğer kullanıcılar tarafından sıkça dinlenen şarkılar da Last.fm tarafından çalınabilir. Kullanıcıların davranışlarını kullanması sebebiyle bu yaklaşım bir işbirlikçi filtreleme örneğidir.
- Pandora bir şarkının ya da sanatçının özelliklerini (Music Genome Project tarafından sağlanan 400 özelliğin bir alt kümesi), benzer özelliklere sahip müziklerin çalındığı bir radyo başlatmak için kullanır. Kullanıcı geri bildirimi kullanılarak radyonun sonuçları iyileştirilir. Kullanıcının "beğenmediği" şarkıların özelliklerini zayıflatır ve "beğendiği" şarkıların özelliklerini güçlendirir. Bu bir içerik-bazlı yaklaşım örneğidir.
Bu sistem tiplerinin her birinin kendi güçlü ve zayıf yanları vardır. Yukarıdaki örnekte, Last.fm isabetli tahminler yapabilmek için bir kullanıcıdan büyük miktarda veri toplamalıdır. Bu durum soğuk başlangıç problemi olarak bilinir ve işbirlikçi filtreleme sistemlerinde sıkça rastlanır.[6] Pandora başlangıç için çok az bilgiye ihtiyaç duyar ama çok daha kısıtlı bir kapsama sahiptir (mesela, sadece başlangıç şarkısına benzer öneriler yapabilir).
Önerici sistemler, kullanıcıların kendilerinin bulamadıkları öğeleri keşfetmelerine yardımcı olarak arama algoritmalarına alternatif oluşturur. İlginç bir şekilde, önerici sistemler yaygın olarak, alışılmamış tipte verileri indeksleyen arama motorları olarak gerçekleştirilir.
Önerici sistemler veri madenciliği ve makine öğrenmesi alanlarında etkin bir araştırma konusudur. Önerici sistem araştırmalarına ev sahipliği yapan konferanslardan bazıları RecSys, SIGIR, ve KDD'dir.
Doğruluğun ötesinde
Önerici sistemler üzerindeki araştırmalar genellikle doğruluğu en yüksek önerme algoritmalarını bulmaya amaçlar. Ancak, önemli olan bir takım başka faktörler de vardır.
- Ayrışma – Kullanıcılar birbirine daha az benzeşen öğeleri tercih edebilir, örn. farklı sanatçılardan öğeler.[7]
- Önerme sürekliliği – Bazen yeni öğeler önermektense daha önce önerilmiş öğelerin tekrar gösterilmesi daha işlevseldir.[8][9]
- Gizlilik – Önerici sistemler sıklıkla kullanıcıların gizlilik kaygılarını dikkate almalıdır.[10]
- Kullanıcı demografisi – Kullanıcıların kimlikleri öneri memnuniyetlerini etkileyebilir.[11]
- Gürbüzlük – Kullanıcı katılımı olan önerici sistemler sahtekârlığa bağışıklı olmalıdır.[12]
- Rastlantısallık – Rastlantısallık "önerilerin ne kadar şaşırtıcı olduğu"'dur.[13]
- Güven – Eğer güven vermiyorsa önerici sistemin kullanıcı nezdinde bir değeri olmaz.[14] Kullanıcılara öneri yöntemlerinin nasıl çalıştığı açıklanarak güven kazanılabilir.
- Etiketleme – Kullanıcı tatmini önerilerin nasıl etiketlendiğine göre değişiklik gösterebilir.[15]
Performans ölçütleri
Önerici algoritmaların etkililiğinin belirlenmesinde değerlendirmeler önemlidir. Yaygın olarak kullanılan metrikler mean squared error (MSE) ve root mean squared error (RMSE)'dir. Kesinlik ve duyarlık ya da DCG gibi bilgi erişim metrikleri önerici yöntemin kalitesini belirlemek için kullanışlıdır. Ancak, klasik değerlendirme ölçütlerinin çoğu fazlaca eleştirilmektedir.[16] Sıklıkla, çevrimdışı olarak adlandırılan bu değerlendirme yöntemlerinin sonuçları kullanıcı tatmini ile örtüşmez.[17]
Ayrıca bakınız
- Soğuk başlangıç
- İşbirliçi filtreleme
- Toplu zekâ
- Örüntü tanıma
Kaynakça
- ↑ Francesco Ricci and Lior Rokach and Bracha Shapira, Introduction to Recommender Systems Handbook, Recommender Systems Handbook, Springer, 2011, pp. 1-35
- ↑ "Facebook, Pandora Lead Rise of Recommendation Engines - TIME". TIME.com. 27 May 2010. http://www.time.com/time/magazine/article/0,9171,1992403,00.html. Erişim tarihi: 1 June 2015.
- ↑ Hosein Jafarkarimi; A.T.H. Sim and R. Saadatdoost A Naïve Recommendation Model for Large Databases, International Journal of Information and Education Technology, June 2012
- ↑ Prem Melville and Vikas Sindhwani, Recommender Systems, Encyclopedia of Machine Learning, 2010.
- ↑ R. J. Mooney and L. Roy (1999). "Content-based book recommendation using learning for text categorization". In Workshop Recom. Sys.: Algo. and Evaluation.
- ↑ Andrew I. Schein, Alexandrin Popescul, Lyle H. Ungar, David M. Pennock (2002). "Methods and Metrics for Cold-Start Recommendations". Proceedings of the 25th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2002). New York City, New York: ACM. ss. 253–260. ISBN 1-58113-561-0. http://citeseer.ist.psu.edu/schein02methods.html. Erişim tarihi: 2008-02-02.
- ↑ Ziegler, C.N., McNee, S.M., Konstan, J.A. and Lausen, G. (2005). "Improving recommendation lists through topic diversification". Proceedings of the 14th international conference on World Wide Web. s. 22–32.
- ↑ Joeran Beel, Stefan Langer, Marcel Genzmehr, Andreas Nürnberger (September 2013). "Persistence in Recommender Systems: Giving the Same Recommendations to the Same Users Multiple Times". Trond Aalberg and Milena Dobreva and Christos Papatheodorou and Giannis Tsakonas and Charles Farrugia. Proceedings of the 17th International Conference on Theory and Practice of Digital Libraries (TPDL 2013). Lecture Notes of Computer Science (LNCS). 8092. Springer. s. 390–394. http://docear.org/papers/persistence_in_recommender_systems_--_giving_the_same_recommendations_to_the_same_users_multiple_times.pdf. Erişim tarihi: 1 November 2013.
- ↑ Cosley, D., Lam, S.K., Albert, I., Konstan, J.A., Riedl, {J}. (2003). "Is seeing believing?: how recommender system interfaces affect users' opinions". Proceedings of the SIGCHI conference on Human factors in computing systems. s. 585–592.
- ↑ {P}u, {P}., {C}hen, {L}., {H}u, {R}. (2012). "Evaluating recommender systems from the user's perspective: survey of the state of the art". User Modeling and User-Adapted Interaction (Springer): 1–39.
- ↑ Joeran Beel, Stefan Langer, Andreas Nürnberger, Marcel Genzmehr (September 2013). "The Impact of Demographics (Age and Gender) and Other User Characteristics on Evaluating Recommender Systems". Trond Aalberg and Milena Dobreva and Christos Papatheodorou and Giannis Tsakonas and Charles Farrugia. Proceedings of the 17th International Conference on Theory and Practice of Digital Libraries (TPDL 2013). Springer. s. 400–404. http://docear.org/papers/the_impact_of_users'_demographics_(age_and_gender)_and_other_characteristics_on_evaluating_recommender_systems.pdf. Erişim tarihi: 1 November 2013.
- ↑ {K}onstan, {J}.{A}., {R}iedl, {J}. (2012). "Recommender systems: from algorithms to user experience". User Modeling and User-Adapted Interaction (Springer): 1–23.
- ↑ {R}icci, {F}., {R}okach, {L}., {S}hapira, {B}., {K}antor {B}. {P}. (2011). "Recommender systems handbook". Recommender Systems Handbook (Springer): 1–35.
- ↑ Montaner, Miquel, L{\'o}pez, Beatriz, de la Rosa, Josep Llu{\'\i}s (2002). "Developing trust in recommender agents". Proceedings of the first international joint conference on Autonomous agents and multiagent systems: part 1. s. 304–305.
- ↑ Beel, Joeran, Langer, Stefan, Genzmehr, Marcel (September 2013). "Sponsored vs. Organic (Research Paper) Recommendations and the Impact of Labeling". Trond Aalberg and Milena Dobreva and Christos Papatheodorou and Giannis Tsakonas and Charles Farrugia. Proceedings of the 17th International Conference on Theory and Practice of Digital Libraries (TPDL 2013). s. 395–399. http://docear.org/papers/sponsored_vs._organic_(research_paper)_recommendations_and_the_impact_of_labeling.pdf. Erişim tarihi: 2 December 2013.
- ↑ Turpin, Andrew H, Hersh, William (2001). "Why batch and user evaluations do not give the same results". Proceedings of the 24th annual international ACM SIGIR conference on Research and development in information retrieval. s. 225–231.
- ↑ Beel, Joeran; Genzmehr, Marcel; Langer, Stefan; Nürnberger, Andreas; Gipp, Bela (2013-01-01). "A Comparative Analysis of Offline and Online Evaluations and Discussion of Research Paper Recommender System Evaluation". Proceedings of the International Workshop on Reproducibility and Replication in Recommender Systems Evaluation. RepSys '13 (New York, NY, USA: ACM): 7–14. DOI:10.1145/2532508.2532511. ISBN 9781450324656. http://doi.acm.org/10.1145/2532508.2532511.