Matematik... Bir çoklarımız korkulu rüyası. Onu anlayamıyoruz, anlasak bile matematiğin o soyut düünyası ile kendi dünyamız arasında bağlantı kuracağımızı bilemiyoruz. Yani sadece anladık sanıyoruz. Belki sayılar, simgeler ve operatörler içinde kaybolmuşken kelimeleri özlüyoruz. Kitaplar küçük bir kaçış oluyor bizim için.
Bu yazımda size edebiyatın içindeki matematiği anlatacağım. Aslında sadece edebiyat demek doğru olmaz, sanatın içinde kendine yer bulmuş bir istatistik bilimi olan sayısal üslup analizi yani stilometri'den' bahsediyorum. Sayısal üslup analizi kullanarak eser sahibine, yaşına, cinsiyetine hatta eserin yapıldığı tarihe veya cağrafyaya özgü olabilen ve eserde düzenli ve anlamlı olarak gözlemlenebilen biçimsel ölçütleri elde edilir. Bu biçimsel ölçütler daha sonra yazarı bilinmeyen bir kitabın yazarının tahmin edilmesi gibi konularda kullanılır.
Stilometri Tarihi
Stilometri ismi Türkiye'de pek bilinmese de oldukça eski bir metottur. Bu ismin Türkiye'de
bilinmemesinin sebebinin,
metin madenciliği ya da doğal dil işleme gibi isminlrin daha sık kullanılması olabilir. Stilometri
üzerine en eski çalışmlardan
biri 1439 yılında Donation of
Constantine metninin
sahte olduğunu kanıtlayan Lorenzo Valla'nın
çalışmasıdır. Valla metnin
sahteliğini kanıtlamak için, metnin dilini, metnin yazıldığı iddia edilen 4. yüzyıl metinleri ile
karşılaştırmıştır.
1851'de Augustus de Morgan yazdığı bir mektubunda, yazarı kim olduğu bilinmeyen metinlerin kimin
olduğunu bulmak için
metinde geçen aynı uzunluktaki kelimelerin sayısına bakılabileceğinden bahsetmiştir.
1890'da stilometrinin temelleri Polonyalı filozof Wincenty Lutosławski
tarafından Principes de stylométrie'de atılmıştır. Lutosławski, Platon'un Diyalogları'nın bir
kronolojisini geliştirmek için bu yöntemi kullandı.
1901 yılında Thomas C. Mendenhall Bacon, Marlowe ve Shakespeare'in metinlerinin kelime uzunluğu
dağılımlarını
inceleyerek el ile yapılan ilk stilometri çalışmasını gerçekleştirmiştir.
1960'lı yılların başında ise bilgisayar yardımı ile yapılan ilk çalışma Mosteller ve Wallace'ın,
yazarları uzun süredir tartışmalı olan The
Federalist Papers üzerine yaptıkları çalışmadır.
Stilometri Uygulamaları
Stilometri metinlere yazar ataması için yapılmaya başlanmış olsa da, gelişen teknoloji ve değişen zaman
ile farklı
amaçlar ve çözümler için de uygulanmıştır. Bu uygulamalar genellikle yazar ataması, yazar doğrulaması,
yazar profilleme
ve tarih ataması (stylochronometry) başlıkları ile yer bulmuştur.
Yazar ataması, metinlerin belirli bir yazar tarafından yazılmış olması ihtimalini bulmayı
amaçlar. Bu çalışmalarda
altta yatan varsayım, yazarların üsluplarını bilinçli olarak değiştirebilmelerine rağmen, çalışmalarında
her zaman
kendi üslup özelliklerinden bir kısmını farkında olmadan tutarlı bir şekilde kullanacak olmalarıdır.
Yazar ataması,
yazarları bilinen örnek metinlerin üslup analizi sonuçlarının, atama yapılacak metnin analiz
sonuçlarıyla karşılaştırılması ile yapılır. Metne, örnek metinler arasından en benzer olan metnin
yazarı atanabileceği gibi benzerlik için bir alt sınır konulduğu takdirde, örnek metin
yazarlarından herhangi biri atanamayabilir. Benzerşekilde, belli bir benzerlik üstsınırını geçen
metinlerin yazarlarının tümü farklı ihtimaller ile incelenen metne çoklu yazar olarak atanabilir.
Bir başka yazar ataması uygulaması da bir yazarın belli bir alanda yazdığı metnin incelenmesi ile farklı
alanda yazılan başka birmetnin yazarı olup olmadığının tespitidir. Bu problem “Bu romanın yazarı,
bilinen köşe
yazarlarından hangisidir?” sorusu ile doğrudan ilişkilendirilebilir.
Yazar doğrulaması, iki metnin aynı yazar tarafından yazıldığına dair kanıt arar. Karşılaştırılan
metinlerin aynı yazartarafından yazılmadığı durumlarda, yazar doğrulama problemi açık-küme
problemine dönüşür, başka bir deyişle metnin yazarı karşılaştırılan örnekler arasında
olmayabilir.
Yazar profilleme, yazar atamasının uygulanabilir olmadığı durumlarda, yazarın
cinsiyeti, yaşı gibi demografik özelliklerinin belirlenmesi ile arama uzayını daraltmayı amaçlar.
Dil kullanımının yazarların yaşına ya da cinsiyetine göre değişim gösterebilir.
Tarih ataması, tarihi bilinmeyen metinleri, tarihi bilinen metinler ile karşılaştırarak
tarih atamayı amaçlar. Üslup analizi dilin zaman içindeki değişimi göstermek için de
kullanılır. Vurgulayacak olursak, dillerin zamanla değişimi verilen bir metne tarih atamasını mümkün
kılar.
Kısaca özetleyecek olursak, üslup analizi genel anlamda metinlerin biçimsel özellikleri bakımından karşılaştırılması ve karşılaştırma sonuçlarının istatistiksel olarak anlamlı olduğunun doğrulanması ile uygulanır. İstatistiksel olarak anlamlı sonuçlar, iki metnin benzerliğinin (ya da farklılığının), tesadüf sonucu değil, pek çok kere ve istikrarlı bir şekilde gözlemlendiğini ve yeni durumlarda da gözlemlenebileceğini ifade eder.