DeepSeek'ten yapay zeka devrimi: İşte detaylar

DeepSeek şirketi yapay zekayla ile ilgili Tsinghua Üniversitesi'nden araştırmacılarla modellerin pozitif pekiştirme sonucu ile eğitilmesine yönelik yenilikçi yaklaşımın detaylarını açıklayan bir makale yayınladı.

Oxu.Az'ın haberine göre, South China Morning Post konuya ilişkin bilgi paylaştı.

Geliştirilen yöntem, yapay zeka modellerinin insan tercihlerine uyumunu iyileştirmeyi amaçlıyor. Bu yöntem, daha doğru ve anlaşılır cevapların üretilmesini teşvik eden bir ödül mekanizması kullanıyor. Pekiştirmeli öğrenme, dar kapsamlı görevlerde faydasını kanıtlamış olsa da, daha genel görevlere uygulandığında etkinliği azalıyordu. DeepSeek ekibi, üretken ödül modellemesini (GRM) ilke temelli öz eleştirel ayarlama ile birleştirerek bir çözüm önerdi.

Araştırmaya göre, yeni yaklaşım büyük dil modellerinin (LLM) akıl yürütme yeteneklerini geliştirmede mevcut yöntemlerden daha üstün. Testler, GRM kullanılarak eğitilen modellerin genel sorguları işlerken maksimum performans gösterdiğini ve aynı zamanda daha az hesaplama kaynağı gerektirdiğini ortaya koydu.

Yeni modeller, Generalist Reward Modeling (evrensel ödül modellemesi) kısaltmasından gelen DeepSeek-GRM adını aldı. Şirket, modelleri açık kaynak kodlu hale getirme planlarını duyurdu, ancak kesin yayın tarihleri henüz açıklanmadı.

DeepSeek

Yapay zeka (YZ)

Teknolojide yenilik

Teknoloji dünyası

Çin

DeepSeek'ten yapay zeka devrimi: İşte detaylar

"DeepSeek" etiketine göre haberler