Dünyanın ilk yapay zeka yazılım mühendisi verilen görevlerin yüzde 85’inde başarısız oldu

Programlama ve Script dilleri konusunda bilgi paylaşım alanıdır.
Cevapla
Kullanıcı avatarı
velociraptor
Yottabyte4
Yottabyte4
Mesajlar: 50621
Kayıt: 14 Mar 2006, 02:33
cinsiyet: Erkek
Teşekkür etti: 10214 kez
Teşekkür edildi: 8270 kez

Dünyanın ilk yapay zeka yazılım mühendisi verilen görevlerin yüzde 85’inde başarısız oldu

Mesaj gönderen velociraptor »

Resim

Cognition AI tarafından geliştirilen ve Devin olarak adlandırılan dünyanın ilk “yapay zeka yazılım mühendisi” görünüşe göre işini yapmakta oldukça kötü. Yapılan son değerlendirmeler, bu yeni nesil aracın vaat edilen potansiyelden çok uzak olduğunu ortaya koyuyor. Testlerde Devin’in, kendisine verilen görevlerin yalnızca yüzde 15’ini başarıyla tamamladığı görüldü.

BEKLENTİLER BÜYÜKTÜ

Donanımhaber'de yer alan ayrıntılarda aktardığına göre 2024 yılının başlarında Cognition AI tarafından tanıtılan Devin, yazılım mühendislerine yardımcı olmayı amaçlayan bir otomasyon aracı olarak geliştirildi. Aralık 2024'te aylık 500 dolarlık abonelik ücretiyle genel kullanıma sunulan Devin'in, uygulama geliştirme ve hata giderme gibi görevleri baştan sona otonom bir şekilde gerçekleştirebildiği iddia edildi. Araç, Slack üzerinden komut alıyor ve Docker tabanlı bir çalışma ortamında terminal, tarayıcı, kod düzenleyici ve planlayıcı gibi araçlarla çalışıyor.

Resim

Cognition AI'nin açıklamasına göre Devin; API entegrasyonu, kod incelemeleri, altyapı yönetimi gibi görevleri yerine getirebiliyor. Hatta DoorDash üzerinden yemek siparişi verebilecek kadar "kişisel asistan" işlevi gördüğü de belirtiliyor. Bunlar, başlı başına çok büyük bir olay ve iddia.

Bu arada Devin, bir “bileşik yapay zeka sistemi”, yani OpenAI'nı GPT-4o'sunu içeren ve zaman içinde gelişmesi beklenebilecek bir dizi temel yapay zeka modeline dayanıyor. Teorik olarak onların yapabildikleri her şeyi yapması bekleniyor.

SONUÇLAR HAYAL KIRIKLIĞI OLDU

Saygın bir AI araştırma ve geliştirme laboratuvarı olan Answer.AI'dan üç veri bilimcisi Hamel Husain, Isaac Flath ve Johno Whitaker, bu iddiaları test etmek için bir dizi denemeler gerçekleştirdi. Devin ile test edilen 20 görevden sadece üçü başarıyla tamamlanabildi. Devin’in tamamladığı görevler arasında Notion veritabanından Google Sheets’e veri aktarma ve gezegen hareketlerini takip edebilen bir uygulama geliştirme bulunuyor. Ancak daha karmaşık görevlerde Devin, teknik çıkmazlara saplandı veya hatalı çözümler üretti.

Araştırmacılar, Devin'in temel engelleri fark edemediğini ve uygulanabilir olmayan çözümleri zorlamaya devam ettiğini belirtti. Örneğin, Devin’den birden fazla uygulamayı Railway platformuna dağıtması istendiğinde, bu platformun böyle bir özelliği desteklemediğini anlamadı. Günlerce çözüm arayarak zaman kaybetti ve hayali özellikler "uydurdu." Araştırmacılar, Devin’in arayüzünün kullanıcı dostu olduğunu ve bazı görevlerde umut verici sonuçlar verdiğini kabul etseler de, aracın güvenilir olmaktan uzak olduğunu vurguladı: “Daha da endişe verici olan, hangi görevlerin başarılı olacağını tahmin edemememizdi. İlk başarılarımıza benzer görevler bile karmaşık, zaman alıcı yollarla başarısız oluyordu.”

Kaynak :
https://www.cumhuriyet.com.tr/bilim-tek ... du-2292599
Kullanıcı avatarı
burak35
Exabyte2
Exabyte2
Mesajlar: 12612
Kayıt: 07 Eki 2016, 13:06
cinsiyet: Erkek
Teşekkür etti: 7074 kez
Teşekkür edildi: 7762 kez

Re: Dünyanın ilk yapay zeka yazılım mühendisi verilen görevlerin yüzde 85’inde başarısız oldu

Mesaj gönderen burak35 »

Demek ki biraz daha gelişmesi lazım.
Kullanıcı avatarı
root@localhost
Gigabyte2
Gigabyte2
Mesajlar: 2290
Kayıt: 31 Ağu 2022, 17:51
cinsiyet: Erkek
Teşekkür etti: 2870 kez
Teşekkür edildi: 2195 kez

Re: Dünyanın ilk yapay zeka yazılım mühendisi verilen görevlerin yüzde 85’inde başarısız oldu

Mesaj gönderen root@localhost »

burak35 yazdı: 25 Oca 2025, 00:43 Demek ki biraz daha gelişmesi lazım.
Sittin yıl gelişse de olmaz. Ezbere ezbere gider. Tokezler. Bu işi harmaninda öğreneceksin. Bak bizden olmadı. Zamanında membaağına gittik. Yapay zeykadan bir halt olmaz.

Metal britanicca ansiklobedisi olur
Kullanıcı avatarı
burak35
Exabyte2
Exabyte2
Mesajlar: 12612
Kayıt: 07 Eki 2016, 13:06
cinsiyet: Erkek
Teşekkür etti: 7074 kez
Teşekkür edildi: 7762 kez

Re: Dünyanın ilk yapay zeka yazılım mühendisi verilen görevlerin yüzde 85’inde başarısız oldu

Mesaj gönderen burak35 »

Deme öyle ya. En azından telemetri topluyorlar veri topluyorlar usul usul :) Yetmez mi ? :d
Kullanıcı avatarı
root@localhost
Gigabyte2
Gigabyte2
Mesajlar: 2290
Kayıt: 31 Ağu 2022, 17:51
cinsiyet: Erkek
Teşekkür etti: 2870 kez
Teşekkür edildi: 2195 kez

Re: Dünyanın ilk yapay zeka yazılım mühendisi verilen görevlerin yüzde 85’inde başarısız oldu

Mesaj gönderen root@localhost »

burak35 yazdı: 25 Oca 2025, 00:52 Deme öyle ya. En azından telemetri topluyorlar veri topluyorlar usul usul :) Yetmez mi ? :d
Resim

Bak yapay zeka yazılım mühendisinin profil fotosu
Kullanıcı avatarı
burak35
Exabyte2
Exabyte2
Mesajlar: 12612
Kayıt: 07 Eki 2016, 13:06
cinsiyet: Erkek
Teşekkür etti: 7074 kez
Teşekkür edildi: 7762 kez

Re: Dünyanın ilk yapay zeka yazılım mühendisi verilen görevlerin yüzde 85’inde başarısız oldu

Mesaj gönderen burak35 »

Güzelmiş.
Kullanıcı avatarı
TRWE_2012
Exabyte2
Exabyte2
Mesajlar: 12522
Kayıt: 25 Eyl 2013, 13:38
cinsiyet: Erkek
Teşekkür etti: 1341 kez
Teşekkür edildi: 3217 kez

Re: Dünyanın ilk yapay zeka yazılım mühendisi verilen görevlerin yüzde 85’inde başarısız oldu

Mesaj gönderen TRWE_2012 »

Prototipler böyle gelişmeler olması gayet doğal...Gelecek , yapay zeka ve robotik kodlamanın çağı olacak....Eğer bir evladım olsaydı ki (inşallah olacak) onu "Yapay Zeka Tasarım Ve Geliştirme Mühendisliğine" yönlendirirdim.Bunda para ve gelecek var.
Kullanıcı avatarı
burak35
Exabyte2
Exabyte2
Mesajlar: 12612
Kayıt: 07 Eki 2016, 13:06
cinsiyet: Erkek
Teşekkür etti: 7074 kez
Teşekkür edildi: 7762 kez

Re: Dünyanın ilk yapay zeka yazılım mühendisi verilen görevlerin yüzde 85’inde başarısız oldu

Mesaj gönderen burak35 »

Biraz daha beklemek lazım bencede. Ama yinede şimdilik iş görüyorlar tabi. En azından benim işimi görüyorlar.
Cevapla