En son haberleri Facebook sayfamızda takip edin

DeepSeek'ten yapay zeka devrimi: İşte detaylar
DeepSeek şirketi yapay zekayla ile ilgili Tsinghua Üniversitesi'nden araştırmacılarla modellerin pozitif pekiştirme sonucu ile eğitilmesine yönelik yenilikçi yaklaşımın detaylarını açıklayan bir makale yayınladı.
Oxu.Az'ın haberine göre, South China Morning Post konuya ilişkin bilgi paylaştı.
Geliştirilen yöntem, yapay zeka modellerinin insan tercihlerine uyumunu iyileştirmeyi amaçlıyor. Bu yöntem, daha doğru ve anlaşılır cevapların üretilmesini teşvik eden bir ödül mekanizması kullanıyor. Pekiştirmeli öğrenme, dar kapsamlı görevlerde faydasını kanıtlamış olsa da, daha genel görevlere uygulandığında etkinliği azalıyordu. DeepSeek ekibi, üretken ödül modellemesini (GRM) ilke temelli öz eleştirel ayarlama ile birleştirerek bir çözüm önerdi.
Araştırmaya göre, yeni yaklaşım büyük dil modellerinin (LLM) akıl yürütme yeteneklerini geliştirmede mevcut yöntemlerden daha üstün. Testler, GRM kullanılarak eğitilen modellerin genel sorguları işlerken maksimum performans gösterdiğini ve aynı zamanda daha az hesaplama kaynağı gerektirdiğini ortaya koydu.
Yeni modeller, Generalist Reward Modeling (evrensel ödül modellemesi) kısaltmasından gelen DeepSeek-GRM adını aldı. Şirket, modelleri açık kaynak kodlu hale getirme planlarını duyurdu, ancak kesin yayın tarihleri henüz açıklanmadı.
"DeepSeek" etiketine göre haberler
- OpenAI, SoftBank ile 40 milyar dolarlık rekor anlaşmaya imza attı
- Çin'den şok adım: DeepSeek çalışanlarına yurt dışı kısıtlaması
- DeepSeek'in ardından gelen Çinli yapay zeka Manus: Yenilikler ve etkileri
- DeepSeek kullanıcıların kişisel bilgilerini Çin'e aktardı
- Güney Kore DeepSeek yapay zekasının kullanımına geçici YASAK GETİRDİ