Osmanlı'nın yazın dünyası yapay zekayla gün yüzüne çıkıyor
Osmanlı İmparatorluğu döneminde kullanılan Osmanlı Türkçesi, tarih, edebiyat ve Türkoloji gibi bölümler ile bazı özel kurslarda öğretiliyor.
Osmanlı Türkçesinin zengin mirasını koruma ve anlama amacıyla hareket eden bir grup genç girişimci, Osmanlıca yazılan orijinal metinleri yapay zeka yoluyla traskript eden program geliştirdi. Geçmişin izlerini sürmek, tarihi belgeleri anlamak, Osmanlıcanın derinliklerine inmek isteyenler için transliterasyon ve kelime arama özellikleri bulunan program, milyonlarca sayfadan oluşan zengin bir koleksiyon içerisinde veri analizi yapma imkanı sağlıyor.
Hazırladıkları programı "vesiqari" isimli internet sitesi üzerinden araştırmacı ve öğrencilerin kullanımına sunan girişimci Ömeroğlu, AA muhabirine yaptığı açıklamada, Arap alfabesinin çok geniş bir coğrafyadaki İslam alemi tarafından kullanıldığını belirtti.
Araf alfabesiyle yazılan Türkçeye Osmanlı Türkçesi denildiğini aktaran Ömeroğlu, dilin içerisinde Türkçenin yanı sıra Arapça ve Farsça kelimelerin de yer aldığını anlattı.
- Proje fikri öğrenci evinde ortaya çıktı
Projenin 2020'de Boğaziçi Üniversitesinde öğrenci olduğu dönemde bir yayınevine Osmanlı Türkçesi ve farklı dillerden kitap hazırladığı dönemde ortaya çıktığını belirten Ömeroğlu, "Yazılımcı olan ev arkadaşım 'Bunu bir yapay zeka projesi haline dönüştürebilir miyiz? Ben İTÜ'de bitirme ödevimi bununla yapayım, sen de bana Osmanlıca kısmında yardımcı ol.' dedi ve öyle başladık. Kaderin tevafuku, o günün akşamında üniversite mailime TÜBİTAK BİGG'den (Bireysel Genç Girişim) bir teşvik maili geldi. Maille birlikte fikrimizi projelendirip bunu TÜBİTAK'a yazabiliriz diye düşündüm. Endüstri mühendisi olan diğer arkadaşım da işi projelendirip takvimlendirme çalışmasını üstlendi. TÜBİTAK teşvikinin geçmesiyle birlikte İTÜ Teknopark'ta şirketimizi kurduk." ifadelerini kullandı.
Proje üzerinde üç buçuk yıl çalıştıklarını anlatan Ömeroğlu, birçok farklı aşamadan oluşan yapay zeka modellerini kullanarak projeyi kullanılabilir hale getirdiklerini aktardı.
Sistemi bireysel kullanıcılar ve kütüphaneler olarak ikiye ayırdıklarını dile getiren Ömeroğlu, şöyle konuştu:
"Kütüphaneleri de kendi içerisine ikiye ayırdık. Bazı kütüphaneler eserlerini pek paylaşmak istemiyor. Onlar için bir havuz sistemi oluşturduk. Eğer kendi eserlerini paylaşmak isterse başka kütüphanelerin havuzlarından da yararlanıp o kaynakların tamamı tek bir havuz haline geliyor. Böylelikle o kütüphanenin kullanıcısı sisteme girdiği zaman, 7 milyon sayfa arasında istediği herhangi bir belgeyi arayabiliyor. Bir belgenin çevrilmesi 1 dakikadan az sürede tamamlanıyor ve başarı oranı oldukça yüksek. Hem metinde hem de 7 milyonluk bütün bir veri havuzunda kullanıcılar kelime araması yapabiliyor."
- İkinci aşamada metinlerin Türkçe sadeleştirilmiş hali yer alacak
Projenin bir sonraki aşamasında kullanıcıların metinlerin Türkçe sadeleştirilmiş halini de elde edebileceklerini belirten Ömeroğlu, ayrıca birtakım chatbotlar ve özetleme sistemleriyle birlikte metinlerin özetini ve metinlerle konuşabilme imkanını da kullanıcılara sunacaklarını söyledi.
Kullanıcıların metnin kim tarafından ne zaman yazıldığı, ana teması, nelerden bahsettiği gibi soruların cevabını alabileceklerini aktaran Ömeroğlu, ikinci aşama için TÜBİTAK'a yaptıkları başvurunun sonuçlanmasını beklediklerini kaydetti.
Ömeroğlu, amaçlarının bireysel kullanıcılardan para kazanmak olmadığını, bu yüzden cüzi miktarda ücretlendirme yaptıklarını dile getirdi.
Projelerinin benzerlerine göre daha ileride bir sistem olduğuna işaret eden Ömeroğlu, "Bizim diğerlerinden temel farkımız bütün hizmetleri bir arada sunuyor olmamız. Bazı programlarda sadece kelime araması yapabiliyorsunuz. Ama ona dair bir transliterasyon hizmeti alamıyorsunuz ya da tek bir sayfayı koyup transliterasyonunu alabiliyorsunuz. Büyük bir veri havuzunda arama imkanı, onun içerisinde transliterasyon yapma imkanını sunuyoruz. Ayrıca bu veri havuzu sürekli olarak yeni metinlerle genişliyor." değerlendirmesinde bulundu.
Osmanlı Türkçesindeki matbu kitap ve süreli yayınları toplama noktasında koleksiyoner Hakkı Tarık Us ve Seyfettin Özege'nin ciddi çaba sarf ettiğini anlatan Ömeroğlu, bu iki ismin belgelerinin yanı sıra çeşitli kütüphaneler, arşivler ve koleksiyonerlerle görüşerek veri havuzunu genişlettiklerini kaydetti.
"Üye/Üyeler suç teşkil edecek, yasal açıdan takip gerektirecek, yasaların ya da uluslararası anlaşmaların ihlali sonucunu doğuran ya da böyle durumları teşvik eden, yasadışı, tehditkar, rahatsız edici, hakaret ve küfür içeren, aşağılayıcı, küçük düşürücü, kaba, pornografik ya da ahlaka aykırı, toplumca genel kabul görmüş kurallara aykırı, kişilik haklarına zarar verici ya da benzeri niteliklerde hiçbir İçeriği bu web sitesinin hiçbir sayfasında ya da subdomain olarak oluşturulan diğer sayfalarında paylaşamaz. Bu tür içeriklerden doğan her türlü mali, hukuki, cezai, idari sorumluluk münhasıran, içeriği gönderen Üye/Üyeler'e aittir. MİLAT GAZETESİ, Üye/Üyeler tarafından paylaşılan içerikler arasından uygun görmediklerini herhangi bir gerekçe belirtmeksizin kendi web sayfalarında yayınlamama veya yayından kaldırma hakkına sahiptir. Milat Gazetesi, başta yukarıda sayılan hususlar olmak üzere emredici kanun hükümlerine aykırılık gerekçesi ile her türlü adli makam tarafından başlatılan soruşturma kapsamında kendisinden Ceza Muhakemesi Kanunu'nun 332.maddesi doğrultusunda istenilen Üye/Üyeler'e ait kişisel bilgileri paylaşabileceğini beyan eder. "
Yorum yazma kurallarını okudum ve kabul ediyorum.