Akıl Yürütme Yanılsaması: Yapay Zeka Dünyasını Sarsan Tartışma
Apple, LLM'nin klasik problemlerin küçük varyasyonlarında (Hanoi Kulesi, nehir geçişi) nasıl başarısız olduğunu gösteren iki yıkıcı makale -'GSM-Symbolic' (Ekim 2024) ve 'The Illusion of Thinking' (Haziran 2025)- yayınlar: 'sadece sayısal değerler değiştirildiğinde performans düşer'. Karmaşık Hanoi Kulesi'nde sıfır başarı. Ancak Alex Lawsen (Open Philanthropy) başarısız metodolojiyi gösteren "Düşünme Yanılsaması" ile karşılık veriyor: başarısızlıklar muhakeme çöküşleri değil token çıktı sınırlarıydı, otomatik komut dosyaları kısmi doğru çıktıları yanlış sınıflandırdı, bazı bulmacalar matematiksel olarak çözülemezdi. Claude/Gemini/GPT, hamleleri listelemek yerine özyinelemeli işlevlerle testleri tekrarlayarak Hanoi Kulesi'nin 15 kaydını çözdü. Gary Marcus Apple'ın 'dağıtım kayması' tezini benimsiyor, ancak WWDC öncesi zamanlama makalesi stratejik soruları gündeme getiriyor. İş dünyasına etkileri: Kritik görevler için yapay zekaya ne kadar güvenilmeli? Çözüm: nörosembolik yaklaşımlar örüntü tanıma+dil için sinir ağları, biçimsel mantık için sembolik sistemler. Örnek: YZ muhasebesi "ne kadar seyahat masrafı var?" sorusunu anlar, ancak SQL/hesaplamalar/vergi denetimleri = deterministik kod.