Tesarus
Tesarus, sözlüğe benzeyen, ama tanımlar ve okunuşlar yerine eşanlamlılar ve zıt anlamlılardan oluşan bir dizindir. Kısaca tesarusu Hiyerarşik Terimler Dizini olarak adlandırabiliriz.
Böyle bir çalışmanın ilk örneği, 1805'te Peter Roget tarafından oluşturulan ve 1852'de basılan Roget's Thesaurus'tur. Roget's Tesarustaki girdiler, alfabetik olarak değil kavramsal olarak sıralanmıştır.
Eşanlamlı ve zıt anlamlı terimleri barındırmasına rağmen, hiyerarşik terimler dizinindeki girdiler, yalnızca eşanlamlı ve zıt anlamlıların bir listesi olarak düşünülmemelidir. Çünkü bu girdiler, aynı zamanda, benzer sözcükler arasındaki ayrımları ortaya koymak ve tam olarak doğru sözcüğü seçebilmek için tasarlanmıştır. Sözlüğün aksine, hiyerarşik terimler dizinindeki girdiler, sözcükleri tanımlamaz.
Bilişim teknolojisinde, hiyerarşik terimler dizini, bir veritabanını ya da konuya göre anlamsal olarak dikey arama anahtarlarının listesini temsil eder. Yapay Zeka alanında ise, hiyerarşik terimler dizinine bazen ontoloji gözüyle bakılabilir.
Uluslararası standartlarda hazırlanan hiyerarşik terimler dizini veritabanları, genellikle tema ve konularına göre hiyerarşik olarak düzenlenir. Böyle bir hiyerarşik terimler dizini, her terimi bir bağlam içerisine oturtarak kullanıcının içecek anlamındaki “çay” ile dere anlamındaki “çay”ı birbirinden ayırmasını sağlar. Bu tür bir hiyerarşik terimler dizini, genellikle çevrimiçi materyaller için oluşturulacak bir indekste temel olarak kullanılır. Örneğin, Sanat ve Mimarlık Tesarusu, Kanada Miras Bilgileri Ağı tarafından tutulan ulusal müze veritabanını (Artefacts Canada) indekslemek için kullanılmaktadır.
Etimoloji
"Thesaurus" sözcüğü, 16. yüzyıl Yeni Latin dilinden gelmektedir. Latince’deki thesaurus’tan, ondan öncesinde ise, Antik Yunan'daki θησαυρός thisavros ’tan“depo” ya da “hazine” anlamına gelen türemiştir. (Böylece hiyerarşik terimler dizini yapıcı anlamına gelen thesaurer, haznedar anlamına gelen thesaurer’ın eş anlamlısıdır.) Bu anlam, büyük çapta Roget’ın bu terimi kullanış biçimiyle yerleşmiştir.
Tanım
İndeksleme ile ilgili olarak hiyerarşik terimler dizininin resmi bir tanımını yapmak gerekirse:
- belirli bir bilgi alanındaki her önemli terim (sözcük ya da söz öbekleri);
- listedeki her terim için ilgili terimler dizisidir denilebilir.
Bu tanımdan hiyerarşik terimler dizininin belgelerin doldurulması ve geri çağrılması esnasında kullanılan konu başlıklarının ve çapraz başvuruların bir listesi olduğu anlaşılabilir.
Terimler, kavramları temsil eden temel anlamsal birimlerdir. İsim konuşmanın en somut parçası olduğundan, bu terimler genellikle tek sözcükten oluşan isimlerdir. Fiiller de isimlere çevrilebilir – örneğin, “temizler” “temizlik”e; “okur” “okuma”ya vb. Sıfatlar ve zarflar ise, indeksleme için faydalı olan bir anlamı nadiren iletirler. Bir terim anlamı açısından belirsiz olduğunda, tutarlılığı sağlamak ve terimin nasıl yorumlanacağı konusunda yardımcı olmak için “açıklayıcı bilgi” (scope note) eklenebilir. Tüm terimler için açıklayıcı bilgi gerekmez, ama bu bilgiler, hiyerarşik terimler dizininin doğru olarak kullanılmasında ve söz konusu olan bilgi alanının doğru şekilde anlaşılmasında oldukça faydalıdır.
"Terim ilişkileri" terimler arasındaki bağlantılardır. Bu ilişkiler, biçimleri yönünden üçe ayrılır: hiyerarşik, eşdeğersel ya da çağrışımsal. Hiyerarşik ilişkiler kapsamları bakımından daha dar ya da geniş olan terimleri ifade etmek için kullanılır. “Broader Term-BT "(Daha Geniş Kapsamlı Terim) daha genel bir terimdir. Örneğin, “Elektronik Cihazlar”, “Bilgisayar” teriminin genellemesidir. Benzer şekilde, “Narrower Term - NT” (Daha Dar Kapsamlı Terim), daha özel bir terimdir. Örneğin “Bilgisayar”ın daha özelinde yer alan “Dijital Bilgisayar” terimi gibi. BT ve NT iki taraflıdır: daha geniş kapsamlı bir terim, içinde daha dar kapsamlı en az bir terim bulundurmak durumundadır. Hiyerarşik terimler dizini tasarımcıları, BT ve NT’nin parça-bütün ilişkilerinden farklı düşünülecek şekilde sınıf ilişkilerini ifade etmesini sağlamak için genellikle büyük dikkat gösterirler.
Eşdeğerlik ilişkisi, öncelikle eşanlamlı ve yakın anlamlılar arasındaki bağlantıyı sağlamak amacıyla kullanılır. Use-USE (Kullan) ve Used For – UF (Yerine Kullan) göstergeleri, onaylanmış bir terimin onaylanmamış bir başka terim yerine kullanılması gerektiğinde kullanılır; örneğin, onaylanmış bir terim olan “Buğday”, “UF Ekin” göstergesine sahip olabilir. Karşılıklı olarak, onaylanmamış bir terim olan “Ekin” ise “USE Buğday” göstergesine sahip olacaktır. Used For (UF) terimleri, genellikle hiyerarşik terimler dizininde “girdi işaretleri” olarak adlandırılır ve belli bir kavram için uygun olarak seçilen onaylanmış terime (aynı zamanda Tercih Edilen Terim ya da Tanımlayıcı olarak da geçebilir) işaret eder. Bu şekilde, Tercih Edilen Terim, İndeksleme Terim’i olarak önerilme yoluyla otomatik indeksleme yazılımı aracılığıyla metin içerisinde kullanılabilir.
Çağrışımsal ilişkiler, ilişkileri ne hiyerarşik ne de eşdeğer olan iki ilgili terim arasındaki bağlantıyı sağlamak amacıyla kullanılır. Bu ilişki, “Related Term – RT” (İlgili Terim) göstergesiyle açıklanır. “Varlıkbilim” teriminin “Felsefe” terimiyle olan ilgisi bu tür bir ilişkinin örneğidir. Çağrışımsal ilişkiler, dikkatle uygulanmalıdır, çünkü RT’lerin fazla kullanımı araştırmadaki belirliliği azaltan bir niteliğe sahiptir. Örneğin: tipik bir kullanıcının “A” terimi ile arama yaptığını varsayalım. Bu kullanıcı aynı zamanda “B” terimi altındaki kaynaklara da erişmek isteyecek midir? Eğer cevap hayır ise, çağrışımsal ilişki kurulmamalıdır.
Örnekler
- Thesaurus of English Words & Phrases (ed. P. Roget); ISBN 0-06-272037-6, see: Roget's Thesaurus.
- The Synonym Finder (ed. J. I. Rodale); ISBN 0-87857-236-8
- Webster's New World Thesaurus (ed. C. Laird); ISBN 0-671-51983-2
- Oxford American Desk Thesaurus (ed. C. Lindberg); ISBN 0-19-512674-2
- Random House Word Menu by Stephen Glazier; ISBN 0-679-40030-3, hiyerarşik terimler dizini, sözlük ve lügatçe karışımı.
Son yılların önemli hiyerarşik terimler dizini projelerinden biri, halen Glasgow Üniversitesi'nde geliştirilmekte olan İngilizce’nin Tarihi Hiyerarşik Terimler Dizini'dir (HTE). 1964’te başlatılan HTE, Oxford English Dictionary’nin ikinci baskısındaki tüm sözcükleri anlamsal alan ve tarihe göre düzenlenmiş şekilde barındıran bir veritabanı olacaktır. Bu şekilde, HTE, en eski yazılı kayıtlardan (Anglo-Saxon) günümüzdeki kullanım tür ve tarihlerine kadar İngilizce’nin tüm sözcük hazinesini düzenlemektedir. Tarihi bir hiyerarşik terimler dizini olarak, dünya dilleri arasında bir ilktir. HTE projesi altında, tüm HTE veritabanından yola çıkılarak halihazırda Eski İngilizce Hiyerarşik Terimler Dizini</ref> oluşturulmuştur.
Özel alan tesaruslarına
- NAL Agricultural Thesaurus, (United States National Agricultural Library, United States Department of Agriculture)
- Evaluation Thesaurus (by. M. Scriven); ISBN 0-8039-4364-4
- Great Song Thesaurus (by R. Lax & F. Smith); ISBN 0-19-505408-3
- Thesaurus of Psychological Index Terms (APA); ISBN 1-55798-775-0
- Clinician's Thesaurus, (by E.Zuckerman); ISBN 1-57230-569-X
- Art and Architecture Thesaurus, (Getty Institute)
- AGROVOC Thesaurus, (Food and Agriculture Organization of the United Nations)
- GEneral Multilingual Environmental Thesaurus, (European Environment Agency)
Standartlar
2005 yılına ait ANSI/NISO Z39.19 Standardı, listeler,eşanlamlı halkalar,taksonomiler ile tesaruslar da dahil olmak üzere tekdilli kontrollü sözlüklerin formatı, oluşumu, test edilmesi, sürdürülmesi ve yönetimine dair prensipleri ve kuralları tanımlamaktadır.[1]
Çok dilli lugatlarda, çokdilli tesarusların oluşturulması ve geliştirilmesine yönelik ISO 5994 Standardı uygulanabilir.
Ayrıca bakınız
- Kontrollü lugat
- Sözlük
- Ontoloji (bilgisayar bilimi)
- Basit Bilgi Organizasyon Sistemi
- WordNet
Kaynaklar
- Old English Newsletter Online
- ANSI/NISO Z39.19 - 2005 Tek Dilli lugatların oluşturulması, Formatı ve Yönetimi Prensipleri,ISBN 1-880124-65-3.]]