Posts Tagged zemberek

Staj sunumları

İki haftada bir kez sunum yapması gereken stajyerlerimiz bu hafta ikinci sunumlarını gerçekleştirdiler. Paylaşacağım sunumlarda Asım ve Mehmet Ali “Seçim sonuçlarının Türkiye haritası üzerinde gösterimi” konusunu, Merve ise “Zemberek kullanarak Play Framework uygulaması” konusunu işliyor. Söz konusu uygulamalar Play Framework ile geliştiriliyor. Yakın zamanda Play Framework için bir de Türkçe Google Grubu açtık. İlgilenenleri grubumuza bekleriz.







Tags: , , , ,

Zemberek Kütüphanesi ile Java Uygulaması

Merhaba arkadaşlar, daha önceki yazılarımda sizlere java ve zemberek kütüphanesiyle ilgili genel bilgiler vermiştim. Bu yazımda da Zemberek kütüphanesini kullanarak oluşturduğum küçük java uygulamamdan bahsedeceğim.
Ama baştan uyarayım ki javayla tanışalı çok olmadı dolayısıyla daha basit şekilde yazılabilirdi yada şu kısımda başka bir yöntem de kullanılabilirdi dediğiniz yerler olabilir. Bu durumları acemiliğime vermeniz gerekecek :)

İlk olarak uygulamamda kullandığım Zemberek kütüphanesi fonksiyonlarını tanıyalım:
hecele: String türünden bir değişken alıp hecelenmiş halini string dizisi şeklinde döndürür.
Giriş: Ağaçlar
Çıkış: [a, ğaç, lar]
asciiyeDonustur : Aldığı string türünde değişkenin ASCII karakterlere dönüşmüş halini döndürür.
Giriş: Ağaçlar
Çıkış: Agaclar
oner : Aldığı kelimenin harfleriyle oynayarak yeni kelimeler önerir.Daha çok yanlış kelime girildiğinde doğrusunun bulunması için kullanılır.Bir harf eksikliği, bir harf fazlalığı veya yeri yanlış kullanılmış yan yana harf hatalarını giderecek şekilde çözümler üretiyor.
Giriş: Mrhaba
Çıkış: Merhaba
kelimeCozumle: String türü bir değişken alıp Kelime sınıfı cinsinden bir diziyle aldığı kelimenin olası tüm çözümlemelerini (kök+ekler) döndürür.
Giriş: Ağaçlar
Çıkış: [ Kok: ağaçla, FIIL ] Ekler: FIIL_GENISZAMAN_IR
[ Kok: ağaç, ISIM ] Ekler: ISIM_COGUL_LER
[ Kok: ağaç, ISIM ] Ekler: ISIM_DONUSUM_LE + FIIL_GENISZAMAN_IR
[ Kok: ağaç, ISIM ] Ekler: ISIM_KISI_ONLAR_LER
kelimeDenetle: Aldığı string türü değişkenin doğru yada yanlış yazıldığına dair bool değer döndürür.
Giriş: Ağaçlar
Çıkış:1 (Doğru yazıldığını gösterir.)
kelimeAyrıştır: Aldığı string türü değişkene ait olası ayrıştırma sonuçlarını (kök ve ek oluşumları) string dizisi şeklinde ifade eden liste döndürür.
Giriş: Ağaçlar
Çıkış: [ağaç, lar]
[ağaçla, r]
[ağaç, la, r]
[ağaç, lar]

Read the rest of this entry »

Tags: , ,

ZEMBEREK Kütüphanesi ve Genel Özellikleri

Zemberek, açık kaynak kodlu Türkçe doğal dil işleme kütüphanesidir. Java ile geliştirilmektedir ve yazım denetimi, hatalı yazımlar için öneri, heceleme,  çözümleme gibi işlevlere sahiptir.

Zemberek: Kütüphanenin ilk sürümüdür ve BSD( yazılım üzerinde neredeyse hiçbir sınırlama getirmeyen bir lisanslama modeli) lisansına sahiptir.

Zemberek2: Kütüphanenin ikinci sürümüdür ve MPL lisansına sahiptir.

NZemberek: Kütüphanenin .net sürümünü  oluşturmak için başlatılan projedir.

Zemberek’in geliştiricileri Ahmet ve Mehmet D. Akın tüm kelime köklerini tek tek elle sınıflandırmış, gerekli özel durumları(öneriler) ve kök bilgilerini ekleyerek uzun ve bir o kadar yorucu bir çalışmayla bu kütüphaneyi oluşturmuşlar. Şimdilik kütüphanenin nasıl oluşturulduğunu anlamaya çalışmamıza gerek yok. Tabi ki kütüphanenin genel yapısını bileceğiz ama bizim asıl  araştırıp düşünmemiz gereken, bu kütüphaneyi kullanarak neler yapabiliriz  veya  kütüphanenin gelişimine nasıl yardımcı olabiliriz olmalı..

Zemberek kütüphanesi henüz kelime tabanlı işlemler yapıyor. Cümle, anlam ilişkili işlemler konusunda çalışmalar devam ediyor. Kütüphane fonksiyonlarıyla yazım denetimi, hatalı yazılımlar için öneri, heceleme, çözümleme, ASCII- Türkçe veya Türkçe-ASCII dönüşümleri, kök bulma, kelime üretimi gibi birçok işlevi kullanarak çok güzel ve kapsamlı uygulamalar oluşturabilirsiniz.

Zemberek kütüphanesi ile çalışırken  bir hata ile karşılaşırsanız ki kütüphanenin hala geliştirilmekte olduğunu düşünürsek bu gayet normal, hatayı  dev@zemberek.dev.java.net adresine  gönderebilirsiniz. Sadece hatalarda değil kütüphane ile  ilgili  önerilerinizde  veya gelişimine katkı sağlamak amaçlı da bu adresi kullanabilirsiniz.

Zemberek dedim durdum da Microsoft ürünlerinde Türkçe için imla denetimi yıllardır mevcut ve üniversitelerimizde bu konuya ilişkin ciddi çalışmalar geliştirilmekteyken Zemberek’in bunlardan farkı ne derseniz?

*Zemberek’in bu çalışmalardan tek farkı  açık kaynak kodlu olmasıdır.  Ayrıca böyle bir işi Türklerin yapıyor olması gurur verici…

“Tamam  bunlar çok güzel de gelelim ücret konusuna” derseniz  :) , yazımın başında da söylediğim gibi Zemberek açık kaynak kodlu bir kütüphane yani istediğiniz amaçla, istediğiniz yazılımda hiçbir ücret ödemeden kullanabilirsiniz.

Konu hakkında yardımcı olabilecek adresler:

https://docs.google.com/Doc?id=ah8p92nkjzcw_8dhssst

http://tr.wikipedia.org/wiki/Zemberek_(yaz%C4%B1l%C4%B1m)

Üzerinde durmayalım dediğim kütüphanenin oluşturulmasını merak edenler için de :

https://docs.google.com/Doc?id=ah8p92nkjzcw_13c7zfq9

İyi çalışmalar :)

Tags: ,