Alışveriş listemizdeki “havuçlar” ile “patatesler” arasındaki karalamayı okumak bazen zorlayıcı olabilir. Ancak yakın gelecekte, yapay zeka (AI) bu konuda yardımcı olabilir.
Son on yılda, bilgisayarları el yazısı belgelerini okumayı öğretme konusunda çalışan araştırmacılar önemli adımlar attılar. Makine öğreniminde olduğu gibi, bilgisayara bir dizi eğitim verisi sağlanır: el yazısı görüntüleri ve yazının ne olduğuyla ilgili detaylar. Bilgisayar, her sayfadaki işaretlerin harflerle nasıl ilişkilendiğini öğrenir. Yarı daire şeklindeki işaretin “c” olduğunu, kısa dikey çizginin “i” olduğunu öğrenir ve bu sayede alışveriş listesine “pirinç” yazdığınızı anlayabilir.
Bu sürecin iç çalışma mekanizması tam olarak bilinmese de, makine öğrenimi genellikle bir kara kutu olarak adlandırılır. Ancak büyük olasılıkla en azından kısmen, hangi karakterlerin sırayla olası olduğunu öğreniyor. Bu da “qvjx” için alışveriş yapmak istemediğinizi belirlemesine yardımcı oluyor, bu kelime ne kadar benzese de.
Bu teknoloji, farklı ülkelerden ve dönemlerden el yazılarına uygulanmış durumda. Ortaçağ el yazmalarından 19. yüzyıl günlüklerine kadar birçok dilde, Latin’den Eski Fransızcaya ve İbranice’ye kadar birçok dilde çalışılmış durumda.
Yapay Zekanın arşiv uygulamalarından biri, bilgiye erişimi demokratikleştirmesi. El yazmalarının dijitalleştirilmesi, birçok kütüphanenin koleksiyonlarını bir tıklama uzaklığına getirdi (elbette siber suçluluğa karşı önlemler alınmış olsa da). Ancak bunları okumak için hala belirli üniversitelerde mevcut olan uzun eğitimlere ihtiyaç duyuluyor.
Yapay Zekanın sağladığı bir başka avantaj da, makine tarafından okunabilir bir versiyonun nispeten kolayca oluşturulabilmesidir. Dil hala bir engel ise, bu transkript makine çevirisi ile birleştirilebilir ve kullanıcıya, manuskriptle yan yana bir İngilizce (veya Fransızca veya Çince) versiyon sunabilir.
Bu süreçlerin elde edeceği veri miktarının bilime önemli etkileri olacaktır. Birçok Ortaçağ el yazması Ortaçağ’dan bu yana hiç okunmamış durumda. Geçmişte, temel sorular genellikle tek bir heceleme gibi en küçük veri parçacıkları ile çözülmüştür. Ancak HTR sayesinde bu sorulara on binlerce heceleme veri kümesi ile cevap vermeye başlıyoruz: hatta milyonlara kadar ulaşabilir. Ve bu veri setleri ile elde edeceğimiz cevaplar kesinlikle farklı olacak.
HTR’nin üretebileceği verinin zenginliği de dikkate değer. Son beş yüzyılda, ortaçağ metinlerinin temsili, baskı makinesi ve bilgisayar klavyesi tarafından temelde sınırlanmıştır. Bazı ortaçağ yazmanları üç farklı “s” biçimi kullanır, ancak klavyede hepsi bilindik, yılan benzeri “s” olarak transkribe edilmiştir. Noktalama işaretleri, örneğin “punctus elevatus” gibi, modern klavye için uyarlanmak zorunda kalmıştır.
Çünkü HTR, görsel tanıma teknolojisine dayanır, klavyedeki yüz kadar harf formunu tanıyabilir ve onları insanlardan daha doğru bir şekilde çoğaltabilir.
Bu potansiyel uygulamaları gerçekleştirmek, 1150’den önceki en eski İngilizce yazısıyla ilgili yeni bir pilot projem olan Ansund’un hedefidir. Ansund, HTR kullanarak tüm kalan Eski İngilizce metinlerini detaylı bir şekilde transkribe ederek kapsamlı, açık erişimli bir dijital korpus oluşturmayı amaçlamaktadır. Yeni harf formlarını keşfetmekte ne kadar başarılı olduğumuzu görmek ve Eski İngilizce’deki kelime bölümü üzerine ilk önemli veriyi toplamak için heyecanlıyız.
Ansund, el yazmalarına erişimi artırmak için Trinity’deki diğer teknoloji odaklı girişimlerden sadece biridir. Trinity Kitap Merkezi, yazının tarihine ve kitabın paylaşılmasına odaklanmaktadır. Sanal Trinity Kütüphanesi, 60’tan fazla el yazmasını dijitalleştirdi ve bu hafta Ortaçağ El Yazmalarının Çok Sayıda Yaşamı Sempozyumu ile başlıyor.
Yapay Zekanın etik ve tehlikeleri son bir yıl içinde önemli bir dikkat çekmiş olabilir, ancak kültürel mirasımızı anlaşılır ve gezilebilir hale getirme gücü de dikkate değerdir. Yakın bir gelecekte, belki de karmaşık alışveriş listelerinizi çözebilme olasılığı bizi yeni keşiflere sürükleyecektir.