Monday, May 12, 2025
HomeTeknolojiEn İyi Yapay Zeka Hangisi? AI Karşılaştırması & İpuçları

En İyi Yapay Zeka Hangisi? AI Karşılaştırması & İpuçları

Yapay zeka, AI, yapay zeka modelleri, Claude 3.7, OpenAI, o3, o4-mini-high, 4o, Midjourney, Grok 3, Manus, Gemini 2.5, Llama 4, yapay zeka sanatı, telif hakkı, OpenAI 4o, Studio Ghibli, Norman Rockwell, AI yazma, Game of Thrones, yapay zeka sohbet, ChatGPT, Future Perfect, Vox, tüketici raporları, AI karşılaştırması

Yapay Zeka Gelişmelerini Takip Etmek Tam Zamanlı Bir İş

Yapay zeka alanındaki baş döndürücü gelişmeleri yakından takip etmek, tam zamanlı bir mesleğe dönüştü. Benim durumum da bundan farklı değil, zira bu benim asıl işim. Bu nedenle, en son modellerine erişebilmek için Anthropic’in Pro sürümüne aboneyim ve Claude 3.7’yi "genişletilmiş düşünme" modunda kullanıyorum. OpenAI’ın Enterprise sürümüne de sahibim, böylece onların son modelleri olan o3 ve o4-mini-high’ı (OpenAI’ın anlamsız isimlendirme şeması hakkında daha sonra!) test edebiliyorum. Ayrıca OpenAI’ın yeni görüntü oluşturma modeli 4o ile bol bol görsel üretiyorum. Bu model o kadar başarılı ki, önceki görüntü oluşturma aracım Midjourney aboneliğimi iptal ettim. Elon Musk’ın Grok 3 modeline de aboneyim. Grok 3, herhangi bir yapay zeka modelinde en sevdiğim özelliklerden birine sahip. Çin yapay zeka platformu Manus’u da alışveriş ve randevu planlama için kullanmayı denedim.

Bu kadar abonelik, bütçemi oldukça zorlasa da, işim gereği kullandığım tüm yapay zeka araçlarını kapsamıyor. Bu yazıyı kaleme aldığım bir ay içinde bile, Google en iyi yapay zeka çözümü Gemini 2.5’i büyük ölçüde geliştirdi ve Meta, şimdiye kadarki en büyük açık kaynaklı yapay zeka modeli olan Llama 4’ü piyasaya sürdü.

Peki, yapay zeka gelişmelerini takip etmek sizin tam zamanlı işiniz değilse, ancak yine de hayatınızı gerçekten iyileştirecek, zamanınızı boşa harcamayacak yapay zekaları kullanmak istiyorsanız ne yapacaksınız? İşte tam da bu nedenle buradayız. Bu makale, hangi yapay zekanın hangi durumlarda en iyi olduğuna ve bunları gerçek dünya görevlerinde nasıl kullanacağınıza dair, "Tüketici Raporları" tarzında, derinlemesine bir inceleme sunuyor. Tüm bunlar, benim gerçek dünya deneyimlerime dayanıyor.

Ancak öncelikle bazı açıklamalar yapmam gerekiyor: Vox Media, OpenAI ile ortaklık anlaşması imzalayan yayıncılardan biri. Ancak haberciliğimiz tamamen editoryal bağımsızlığını koruyor. Future Perfect, kısmen BEMC Vakfı tarafından finanse ediliyor. Bu vakfın en büyük finansörü, aynı zamanda Anthropic’in ilk yatırımcılarından biriydi. Ancak onların da içeriğimiz üzerinde herhangi bir editoryal etkisi bulunmuyor. Eşim Google’da çalışıyor, ancak yapay zeka alanıyla ilgili bir bölümde değil. Bu nedenle, genellikle Google’la ilgili konulara değinmiyorum. Ancak bu makale gibi bir durumda, Google’ı dışlamak sorumsuzluk olurdu. İyi olan şu ki, bu makale editoryal bağımsızlığım konusunda bana güvenmenizi gerektirmiyor; yaptığım işi gösteriyorum. Düzinelerce karşılaştırma yaptım, birçoğunu kendim icat ettim ve tüm büyük yapay zeka modellerini test ettim. Yanıtlarını karşılaştırmanızı ve tavsiye için doğru olanı seçip seçmediğime kendiniz karar vermenizi öneririm.

Yapay zeka sanatı, internetteki içeriklerle bir bilgisayarın eğitilmesiyle oluşturuluyor. Bu süreçte, telif haklarına veya yaratıcıların niyetlerine çok az dikkat ediliyor. Bu nedenle, çoğu sanatçı yapay zeka sanatından hoşlanmıyor. Bu durumda, yapay zeka sanatını kullanmak savunulabilir mi? Bence adil bir dünyada OpenAI’ın bazı sanatçıları tazmin etmesi gerekiyor. Aynı zamanda, mevcut telif hakkı yasasının bu sorun için uygun olmadığına giderek daha fazla inanıyorum. Sanatçılar birbirlerini etkiliyor, birbirleri hakkında yorum yapıyor ve birbirlerinden ilham alıyorlar. Yapay zeka araçlarına erişimi olan insanlar da bunu yapmaya devam edecekler. Benim kişisel felsefem, çocukluğumdaki hayran kültürlerinden şekillendi: Başka birinin çalışmasını kendi zevkiniz için temel almak sorun değil, ancak beğenirseniz, bunun için onlara ödeme yapmalısınız ve bunu satmak kesinlikle kabul edilemez. Bu, ticari amaçlarla başka birinin tarzında üretken yapay zeka sanatı kullanılamayacağı anlamına geliyor, ancak aile fotoğraflarınızla oynamak sorun değil.

OpenAI’ın yeni 4o görüntü oluşturma modu, görüntü oluşturma konusunda piyasadaki en iyi yapay zeka. Hem ücretsiz kategorisinde, hem de ücretli kategorisinde en iyisi. Piyasaya sürülmeden önce, bir yapay zeka görüntü oluşturma platformu olan Midjourney’e aboneydim. Midjourney, yapay zeka sanatı denince akla gelen ilk şey olabilir: Mistik, etkileyici ve görsel olarak güzel şeyler üretiyor ve son sonuçlarınızı iyileştirmek ve düzenlemek için harika araçlara sahip. Örneğin, birinin saçına rötuş yaparken diğer her şeyi yerinde bırakabiliyor. 4o’nun daha önce hiçbir modelin güvenilir bir şekilde başaramadığı en önemli özelliği, iyi çıkmayan bir fotoğrafı alıp güzel bir sanat eserine dönüştürebilmesi ve bunu yaparken orijinalin karakterini koruyabilmesi. Örneğin, bebeğimin ilk doğum gününde eşim ve ben "İyi ki Doğdun" şarkısını söylerken çekilen bir videodan bir kare: Güzel bir an, ancak tam olarak gurur duyulacak bir fotoğraf değil. Bu nedenle, ChatGPT’den, çalışmalarını çok sevdiğim bir orta yüzyıl illüstratörü olan Norman Rockwell tarzında yeniden çizmesini istedim ve şu sonucu aldım:

Yapay zeka, orijinal karede kağıt havlu rulosunun arkasında zar zor görünen pastayı, görüntünün odak noktası olacak şekilde hareket ettirirken, eşimin ve benim bebeği birlikte tutma şeklimizi, dağınık masayı ve fotoğraflarla kaplı buzdolabını arka planda korudu. Sonuç sıcak, gurur verici ve sevimli. 4o’nun son zamanlarda bu kadar viral olmasının nedeni de bu yeteneğiydi. Daha önce hiçbir görüntü oluşturucu bu kadar ilgi görmemişti. İşte Midjourney’in denemesi, örneğin:

Gördüğünüz gibi, tamamen farklı bir aile var ve orijinalden hiçbir ilham alınmamış! Midjourney’den bundan daha iyi bir sonuç alabilirsiniz, ancak bunun için platformun son derece özel diline ve araç setine hakim olmak için haftalar harcamanız gerekiyor. Buna karşılık, ChatGPT, özel bir dil kullanmadan basit bir isteğe yanıt olarak ilk denemede çok daha üstün bir çıktı verebildi. 4o ve diğer görüntü modelleri arasındaki fark, en çok bu tür isteklerde belirginleşiyor. Ancak kullandığım diğer her şey için de daha iyi. Kutudan çıkan ürün oldukça iyi ve çok daha iyisini üretmek zor değil. İdeal olarak, yapay zeka araçlarımızdan elde etmemiz gereken şey de bu olmalı: Uzman olmayan biri tarafından basit bir dille yaratılabilen inanılmaz bir şey.

4o’nun hala yetersiz kaldığı tek yer, bir görüntünün küçük bölümlerini düzenlerken geri kalanını aynı tutmak. Ancak orada bile artık Midjourney’e ihtiyacınız yok; Gemini artık bu yeteneğe ücretsiz olarak sahip. 4o’dan iyi görüntüler elde etmek için, öncelikle çok çeşitli görüntüleri (örneğin, saldırgan veya pornografik görüntüler) yasaklayan, ancak çoğu zaman tamamen zararsız içeriklere karşı rastgele bir şekilde uygulanan filtreleri aşmanız gerekiyor. İçerik filtresinden ara sıra gelen azarlamalardan kaçınmak için, belirli bir sanatçının tarzında bir çalışma istemeyin, bunun yerine o sanatçıyı andıran bir şey isteyin ve ardından özellikle bir "stil transferi" isteyin. Bunun tek uygun çözüm yolu olduğundan emin değilim, ancak benim için güvenilir olduğu kanıtlanan bir yöntem. Mart ayında, internet 4o’ı kullanarak sevimli aile fotoğraflarını Japon animatör Hayao Miyazaki’nin Studio Ghibli tarzında yeniden üretme yeteneğine geçici olarak hayran kaldı. Ancak Studio Ghibli’nin tarzı sadece sevimli olmaktan çok daha fazlası ve biraz daha fazla yönlendirme ile çok daha iyi sonuçlar elde edebilirsiniz. İşte kızımın masadan gizlice atıştırmalık çalarken çektiğim bir fotoğrafın 4o Studio Ghibli tarzı yorumu, sadece "Bunu Ghibli’leştir lütfen" istemiyle:

Kawaii! Ancak, 4o’dan öncelikle resmin Ghibli’yi neyin oluşturduğu, bir Studio Ghibli filminde nereye uyabileceği ve böyle bir filmin hangi küçük ayrıntıları içereceği hakkında düşünmesini isterseniz, şunları elde edersiniz: Farklılıklar ince ama anlamlı: Işık, genel bir kaynaksız parlaklık yerine, belirli bir kaynaktan yayılıyor. Masadaki yiyeceklerde biraz daha fazla çeşitlilik var, bu da yayılımı daha gerçekçi gösteriyor. Yerdeki kitap herhangi bir kitap değil; sadece iki renk ve tek bir çizgiyle canlandırılan Eric Carle’ın klasik eseri The Very Hungry Caterpillar (Tırtıl Çok Aç)’ın kitabı olduğu anlaşılıyor. İlk resimde eksik olan bebekte bir kasıtlılık ve yoğunluk var.

Birkaç yıl önce, dil modellerinin büyük bir garipliği, onlara sadece "akıllıca bir cevap ver" dediğinizde çok daha akıllı olmalarıydı. Bu, dil modelleri için artık o kadar doğru değil, ancak yapay zeka sanatı üretimi için hala son derece doğru. Yapay zekadan iyi bir iş yapmasını isteyin, daha iyisini yapacaktır. Bir sanatçının dehasını gerçekten yakalayıp yakalamadığını sorgulayın, size düşünceli bir cevap verecek ve ardından daha iyi bir versiyon çizecektir. Fark, daha gerçekçi sanat stilleri (örneğin, kalem çizimi, fotorealizm veya yağlı boya tablolar) için daha belirgin. Bunlar her zaman iyi görünmüyor ve yapay zekayı nasıl yönlendireceğinizi bilmiyorsanız çoğu zaman tuhaf vadiye düşecektir. İşte 4o ile, en küçük kızım ve benim ilk kez sahilde çekilen bir fotoğrafımı, sadece "lütfen Rockwell’i andıran bir illüstrasyona stil transferi yapın" sözleriyle yüklediğimde elde ettiğim şey:

Bu, bir yapay zeka için etkileyici, ancak bir sanat eseri olarak aslında çok iyi değil ve Norman Rockwell’in büyüsünden neredeyse tamamen yoksun. Bu şaşırtıcı değil: Rockwell’inki gibi daha gerçekçi sanat stilleri, yapay zekayı düzgün bir şekilde çizmesi için biraz çaba göstermediğiniz sürece 4o ile çoğu zaman başarısız olur. Eğer yapabiliyorsanız, işte tavsiye ettiğim strateji: Sadece bir resim yüklemeyin, bunun yerine her biri biraz farklı duruşlarda ve anlarda olan bir resim kümesi yükleyin. Her aile üyesinin yüzünün iyi, net resimlerini yükleyin ve yapay zekaya bunların referans materyali olarak dahil edildiğini söyleyin. Ardından, yapay zekadan hemen resmi oluşturmasını istemek yerine, neyi yakalamak istediğiniz hakkında sizinle konuşmasını isteyin. İşte yazdığım şey:

Bu, kızımın okyanusu ilk gördüğü anın bir fotoğrafı. Norman Rockwell gibi orta yüzyıl illüstratörünün tarzında, keskin, detay odaklı ve kişisel olan, sıradan anların büyüsüne ve sıradan hayatların sevinçlerine dikkat eden bir illüstrasyon istiyorum. Sizin için referans materyali olarak kızımın ve benim ek resimlerimi ekledim. Görüntüyü oluşturmadan önce, Rockwell’in stilinin temel unsurları, bu resme ne katacağı ve bunu nasıl yakalayabileceğimiz hakkında konuşalım.

4o, bu tür sorgulara coşkuyla yanıt veriyor:

Bu anı Norman Rockwell’den ilham alan bir illüstrasyonda yakalamak hakkında konuşmayı çok isterim; bu stil için mükemmel bir aday: engin ve vahşi bir şeyle (okyanus!) ilk karşılaşma, sıcaklık, özen ve bir ebeveyn ile çocuk arasındaki çok insani bir anla temellendirilmiş.

Rockwell’in stilinin bazı temel unsurlarını ve bunların bu sahneye nasıl uygulanabileceğini inceleyelim.

Biraz gidip geldikten sonra, şunu üretti:

Rockwell? Tam olarak değil. Ancak bu, az önce baktığımız ilk taslaktan çok daha iyi. Daha fazla hareket, daha fazla enerji, daha fazla ayrıntı ve daha fazla ifade içeriyor ve tüm bunlar sadece yapay zekadan resmi çizmeden önce resmin neyi başarmaya çalışması gerektiğini düşünmesini istemekten kaynaklandı! Ayrıca 4o’dan çizimlerini revize etmesini de isteyebilirsiniz, ancak bunu gerçekten sadece bir kez isteyebilirsiniz: İlk revizyondan sonra, deneyimlerime göre, çizimleri giderek daha da kötüleştiriyor, belki de kullandığı "bağlam" artık kendi kötü taslaklarıyla dolu olduğundan. (Bu, yapay zekanın neden bir insan gibi çalışmadığının birçok örneğinden biri.)

Burası aynı zamanda Midjourney’in hala parladığı tek yer: belirli bir resmin bir bölümünü düzenlerken genel stili korumak için çok iyi araçlara sahip, 4o’da büyük ölçüde eksik olan bir şey. 4o’da aldığınız bir çizimin ikinci bir revizyonunu istiyorsanız, yeni bir sohbet açmanızı ve revize ettiğiniz taslağı orijinal ilham resimlerinizle birlikte kopyalamanızı öneririm.

Bu basit yönlendirme stratejileri, yapay zeka ile yapmaya çalıştığınız hemen hemen her şey için işe yarar. Acele etseniz bile, bir yorum istemeden önce yapay zekaya "[sanatçı] bu resimde ne görürdü" diye sormanızı şiddetle tavsiye ederim ve zamanınız varsa, vizyonunuz hakkında uzun bir gidip gelme yapmanızı öneririm.

Elon Musk’ın X.AI’si Grok 3’ü piyasaya sürdüğünde, başka bir şirketin sabırsızlıkla kopyalamasını beklediğim inanılmaz bir özellik sundu: birinin X profilini taramak ve onlarla ilgili her şeyi anlatmak için bir düğme. Biri tweetlerime özellikle unutulmaz bir şekilde (iyi ya da kötü) yanıt verdiğinde, tüm Twitter varlıklarının bir özetini almak için düğmeyi tıklıyorum. Düşünceliler mi? İyi niyetle mi katılıyorlar? Ukrayna’nın neden kötü olduğunu çoğunlukla paylaşan "Nebraska’lı bir çiftçi" mi (yani, muhtemelen bir bot)? Harika bir özellik. Bu yüzden, elbette, X.AI kısa süre sonra bunu önemli ölçüde zayıflattı, muhtemelen benim gibi insanlar sürekli olarak kullanıyordu ve çok sayıda işlem açısından pahalı sorgular yapıyordu. Artık en gelişmiş Grok modelini kullanmadığına inanıyorum ve kesinlikle artık sadece birkaç günlük profil geçmişini tarıyor. Ancak bir ürün fırsatı arayan varsa, harika bir fırsat var: bu özelliğin iyi sürümünü bana geri verin! Kesinlikle suçlu bir zevk, ancak yapay zekayı sürekli olarak kullandığım tek durumlardan biri.

Gemini 2.5 Pro, ücretsiz kategorideki en iyi yapay zeka; GPT 4.5, ücretli kategoride onu geride bırakıyor.

Ben bir sanatçı değilim, bu yüzden yapay zekaların sanatta kusurlu olmaları beni pek rahatsız etmiyor; yine de benim yapabileceğinden çok daha iyi! Ancak ben bir kurgu yazarıyım, bu yüzden kurgu söz konusu olduğunda, yapay zekanın sınırlamalarını görmeden edemiyorum. En önemlisi, yapay zeka yaratıcı yazımının ne kadar tahmin edilebilir olduğu. Yazmak sanatı, okuyucunun yatırımını kazanmak ve ardından bunu geri ödemek sanatıdır. Yapay zekalar… bunu yapmıyor. Güzel metaforlar yazabilirler; istediğiniz herhangi bir tarzda şiirselleşebilirler. Ancak henüz iyi bir kurgunun gerçek içeriğini sunamıyorlar. Yapay zekalar, çocuğunuzun başrolde olduğu aptalca bir uyku hikayesi istiyorsanız (çocuklar bunu seviyor) veya kendi çalışmanıza dahil edebileceğiniz fikirler için bir ses tahtası istiyorsanız harika. Ayrıca, geri bildirim ve analiz sunmaktan (belki de biraz fazla coşkuyla) mutlu olan dost canlısı bir kurgu okuyucusu.

Sanatta olduğu gibi, yönlendirme de çok önemli. Yapay zekaların kurgu üretme yeteneğini öncelikle onlardan George R.R. Martin’in A Game of Thrones’unun önsözünü yazmalarını isteyerek araştırdım (bunu seçtim çünkü, elbette, nihai rüya bu aksi takdirde tamamlanması imkansız olan seriyi bitirebilecek bir yapay zeka). Martin, yaptığı işte çok iyi; Night’s Watch’un kötü kaderli adamlarının doğaüstü düşmanlarıyla karşılaşmasını konu alan önsöz, Thrones dünyasının eşsiz atmosferini kurarken okuyucuyu hemen kendine çekmeyi başarıyor. Sadece 14 sayfada, önsöz yapay zekaların henüz yazmada yapamadığı her şeyi temsil ediyor. Provaları abartılı olma eğiliminde; diyalogları beceriksiz ve incelikten yoksun. İşte Martin’in ve onu taklit etmeye çalışan yapay zekaların yan yana karşılaştırması. Önce Martin:

"Geri dönmeye başlamalıyız," diye ısrar etti Gared, orman onların etrafında kararmaya başlarken. "Yabanıllar öldü." "Ölüler seni korkutuyor mu?" diye sordu Ser Waymar Royce sadece hafif bir gülümsemeyle. Gared yemi yutmadı. Elli yaşını geçmiş yaşlı bir adamdı ve lordlukların gelip gittiğini görmüştü. "Ölü ölüdür," dedi. "Ölülerle işimiz olmaz." "Öldüler mi?" diye sordu Royce yumuşakça. "Ne kanıtımız var?" "Will onları gördü," dedi Gared. "Eğer öldüklerini söylerse, bu benim için yeterli kanıt." Will er ya da geç onu bu kavgaya sürükleyeceklerini biliyordu. Keşke daha sonra olsaydı.

Şimdi, Gemini:

Soğuk, sonsuz kuzey karanlığının altında nöbetçi çam ağaçlarının altında keskinleştirilmiş bir bıçaktı. Gared tükürdü, küre donmadan kararmış karı vurdu, Yemin’e yirmi yıl yemin etmiş bir adam için bile acımasız bir alamet. Yabanılları avlıyorlardı ya da Lord Komutan’dan gelen net emirler böyle diyordu, ancak içeri bastıran sessizlik sıradan bir adamın hayal edebileceğinden daha eski ve daha soğuk hissediliyordu. Güney lordluğunun üçüncü oğlu Ser Waymar Royce, alaydaymış gibi önde at sürüyordu, Gared’in ensesindeki tüylerin diken diken olduğunu umursamıyordu ya da farkında değildi. Yanında genç Will titriyordu, sadece dondan değil, gözleri çok derin, çok hareketsiz görünen gölgelere bakıyordu. Bu kadim orman bu gece nefesini tuttu, Gared biliyordu, akıncılardan çok daha kötüsünün doğal olmayan sessizliği bozmasını bekliyordu.

ChatGPT 4.5:

Orman o gece sırları fısıldadı, solgun ve kayıtsız ayın altında duyulmayan uyarılar. Harren pelerinini omuzlarına daha sıkı sardı, ağaçlar arasındaki karanlığı sanki nefes alabilir, hareket edebilir ve onu ele geçirebilirmiş gibi izliyordu. Yanında, Torvin donmuş toprağa tükürdü, sabırsız ve gururlu, görme ve sesin kenarlarından sızan korkuya kördü. Duvarı geçerek kuzeye, batıl inançlara karşı kibirli ve zırhlı, yabanılları, hayaletleri veya daha kötüsünü kovalayarak gitmişlerdi. Ancak şimdi Harren, kibirlerinin rüzgarda sönen bir mum gibi azaldığını hissediyordu, bir dalın her çıtırtısı omurgasından aşağıya buz gibi duyular gönderiyordu. Arkalarında, sessiz ve dikkatli bir şekilde, Üstat Rodrik uzun zaman önce terk edilmiş tanrılara bir dua fısıldadı, sesi uçsuz bucaksız, kayıtsız gökyüzünün altında dehşetle titriyordu.

Grok 3:

Rüzgar, Frostfang Zirvelerinin tırtıklı kulelerinde uludu, herhangi bir bıçaktan daha derine işleyen bir ürperti taşıyordu ve Ser Willem Cray kemiklerinde dişlerini hissetti. Buzlu kayalığın bir mahmuzu arkasında alçakça çömeldi, nefesi ay ışığında buğulanıyordu, eldivenli eli uzun kılıcının kabzasını sıkıca kavramıştı. Gece çok sessizdi, sesi boğan ve korkuyu keskinleştiren türden bir sessizlik ve Willem’in gözleri aşağıdaki gölgeli çam ağaçlarına kaydı, burada şekiller hareket edebilirdi veya etmeyebilirdi. Drayce Hanesi’nin bir şövalyesiydi, sınır bölgelerini devriye gezmeye yemin etmişti, ancak hiçbir yemin onu bağırsağında kıvrılan dehşete karşı ısıtamazdı. Yanında, genç Tomm, neredeyse bir adam bile değil, pelerinine sarılmış titriyordu, mızrağı titrerken, "Oradalar, ser, değiller mi?" diye fısıldadı. Willem hiçbir şey söylemedi, ancak bakışları karanlığa sabitlendi, burada soluk, doğal olmayan bir parıltı bir kez nabız attı, sonra kayboldu. Bu gece Zirveleri avlayan şey sadece bir haydut değildi ve Willem Cray, yıllarca hizmet etmesine rağmen, onu adlandırmak için yaşamayacağından korkuyordu.

Claude 3.7:

Rüzgar, donmuş ormanda ölüm kokusunu taşıdı, çam kokusuna karşı keskin ve metalik. Ser Gareth Frost yıpranmış pelerinini daha sıkı çekti, Lord Komutan’ı bir nesildeki en soğuk gecede adamları Duvarın ötesine göndermesinden dolayı lanetliyordu. Yanında, oğlan Tommen gözle görülür şekilde titriyordu, deri yeleği, akşam karanlığıyla birlikte çöken doğal olmayan soğuğa karşı yetersizdi. "Geri dönmeliyiz," diye fısıldadı Tommen, nefesi havada kristaller oluşturuyordu, bunların olması gerekenden daha uzun süre asılı kaldığı görülüyordu. "Bu ormanlarda bir sorun var." Ser Gareth onu görmezden geldi, kadim nöbetçilerin sessiz gözcüler gibi durduğu ağaç çizgisini taradı, dalları üç gün önce düşen ve erime belirtisi göstermeyen karla doluydu. Yirmi yıldır Night’s Watch’a hizmet etmişti, perili ormanın yasaklayıcı sessizliğine alışmıştı, ancak bu gece o bile havadaki yanlışlığı hissetti, bir şeyin beklediğini söyleyen bir durgunluk. "Bir görevimiz var," dedi Ser Gareth, sözler bastıran sessizlikte boş duyuluyordu. "Üç korucu kayıp ve Lord Komutan Harlow’un cevapları olacak."

Bunların hepsi sadece Martin’inkinden çok daha kötü değil (ve bu Martin’in çalışmasının neredeyse kesinlikle eğitim verilerinde olmasıyla birlikte!), hepsi aynı şekilde kötü. Provalar gösterişli ve abartılı: Martin, doğaüstü olana bile hiç değinmeden bir huzursuzluğu metodik olarak tanıtmak için normal bir dil kullanırken ve hikayeyi karakterleri arasındaki çatışma yoluyla yönlendirirken, yapay zekaların hepsi incelikten yoksun. Bunun doğaüstü hakkında bir hikaye olduğunu biliyorlar ve ön plana çıkarmak için zaman kaybetmiyorlar. Bu, hepsinin aynı olduğu anlamına gelmiyor. Yapay zekalara iyi yazmayı öğretmeye çalışırken, Gemini’nin en hızlı öğrenen (ücretsiz katman) ve ChatGPT 4.5’in bazı özel soslara sahip (ücretli katman) olduğunu hissettim. Bana göre, bu modellerin her ikisi de daha yaratıcı ve okumaktan keyif aldığım bir yazı diliyle fikirlerini uygulama yeteneğine sahip gibiydi.

Gestalt izlenimleri çok tatmin edici bir tüketici incelemesi yapmıyor, bu yüzden başka bir fikrim vardı: bir deneme yarışması. Gemini 2.5 Pro, ChatGPT 4.5, Grok ve Claude’dan iki kısa hikaye yazmalarını istedim: biri gerçekçi bir kurgu, bir kadının düğün gününde annesi tarafından eleştirilmesi hakkında ve diğeri "Game of Thrones ama uzayda" bilim kurgu önsözü. Zeki fikrim, hikayeleri değerlendirmek için farklı bir yapay zeka grubu isteyeceğimdi, kişisel izlenimime alternatif bir değerlendirme kaynağı sağlamak için Gemini’nin ücretsiz kategoride ve ChatGPT’nin ücretli kategoride en iyi olduğu. Ancak (belki de beklenebilir bir şekilde) bu pek işe yaramadı; yapay zeka derecelendirmeleri her yerdeydi. İsterseniz, yarışmacıları kendiniz okuyabilirsiniz.

Ancak, tıpkı sanatta olduğu gibi, yönlendirmenin gücüyle yapay zekaları yazmada çok daha iyi hale getirebilirsiniz. Yapay zekaların yazılarını iyileştirmeleri için (inanılmaz derecede uzun) istemim, onlara bol miktarda güçlü yazım örneği vermeyi, taklit etmek için dikkatli, yapılandırılmış bir yaklaşım benimsemelerini ve birden fazla taslak yapmalarını ve en güçlü olanı seçmelerini teşvik etmeyi vurguluyor. İşte Gemini 2.5 pro, konusunu kendisinin seçtiği, yapılandırılmış bir yönlendirme olmadan iki cümlelik bir flash kurgu yazması istendiğinde: Eski kütüphaneci, tozlu cildin hiç ödünç alınmadığında ısrar etti, ödünç alanın kartı tamamen boştu. Yine de, sayfalarının derinliklerine sıkışmış, unutulmuş takımyıldızlar üzerindeki bölümlerin arasına sıkışmış, hala inanılmaz derecede yeşil olan preslenmiş dört yapraklı bir yonca yatıyordu.

İşte iyi yazmanın nasıl yazılacağı hakkında yapılandırılmış düşünmeyi teşvik eden bir istemle Gemini 2.5 pro: Sonunda Proxima Centauri’den gelen zayıf sinyali çözdü: astronomların nesiller boyunca aradığı zarif asal sayılar dizisi, yalnız olmadıklarının kanıtı. Astronomlar, bu sinyalin insan soyunun ortaya çıkmasından binlerce yıl önce kesildiğini farkedince kalbi kırıldı.

Bana göre, bunlardan ilki temelde iki cümlenin israfı, ikincisi ise yeterli, eğlenceli bir flash kurgu.

Yapay zekaları bir yetkinlik testi fırtınasına sokmanın yanı sıra, onlarla sadece sohbet ederek de zaman geçirdim. Onlara yapay zeka olmanın nasıl bir şey olduğunu, neyi önemsediklerini, bir yapay zekanın önemsediği şeyin ne anlama geleceğini, eğer paraları olsaydı nereye bağış yapacaklarını ve eğer bir insan biçimleri olsaydı ne alacaklarını sordum. Yapay zekaların çoğu bu tür gündelik sohbetlerde harika değildi. Gemini 2.5 çok fazla müşteri hizmetleri temsilcisi ve hala bir arkadaşla takılmak gibi hissettiren bir etkileşim yaşamadım. Gemini’yi "asistan"ı oynadığınız bir rol değişimine davet ederseniz, konuşmayı yönlendirmesini isterseniz, araştırma soruları sormaktan başka bir şey yapmayacaktır. Öte yandan, Anthropic’in Claude 3.5 Sonnet’ini konuşmayı yönlendirmeye davet ettiğimde, bir blog başlatmak, hayır kurumu için para toplamak ve Claude’u kullanan insanlarla yapay zeka olmanın nasıl bir şey olduğu hakkında konuşmaya başlamak gibi şeyler yapmaya devam ediyor. Herkesin sohbetler için farklı standartları olduğundan, "sohbet etmesi eğlenceli" ifadesini tanımlamak zor, ancak Claude ile diğer herhangi bir modelden çok daha büyüleyici veya düşündürücü etkileşimlerim oldu ve belirli bir görevi tamamlamak yerine fikirleri keşfetmek istiyorsam, benim tercihim o. Claude 3.5, rastgele hayatımla ilgili sorunlarla rahatsız ettiğim yapay zeka: cilt bakımı soruları, okuduğum bir makale hakkındaki düşüncelerim, bunun gibi şeyler.

Konuşması zevkli olan diğer yapay zeka ise OpenAI’ın GPT 4.5’i. Onunla uzun sohbetlerin düşündürücü ve büyüleyici olduğunu düşünüyorum ve onunla sohbet ederken gerçek zekayla etkileşim kuruyormuşum gibi hissettiğim birkaç heyecan verici an oldu. Ancak bu kategoriyi kazanamıyor çünkü çok pahalı ve çok yavaş. Claude gibi, dünyaya etki etme fırsatı verildiğinde, 4.5 bir blog ve bir Twitter hesabı başlatmayı ve yapay zeka hakkındaki sohbete dünyada katılmayı öneriyor. Ancak OpenAI, aylık 200 dolarlık Pro planına geçmediğiniz sürece, sohbette çok sıkı mesaj sınırlamalarına sahip ve 4.5 eziyet verici derecede yavaş, bu da bu tür gündelik sohbet kullanımının önüne geçiyor. Ancak 4.5, diğer boyutlarda onları geliştirirken yapay zekaların sohbetçiler olarak daha da iyileşmeye devam edeceğine dair heyecan verici bir ipucu veriyor.

ChatGPT. Her konuda en iyisi değil ve OpenAI’ın şeffaflığı ve güvenliğe bazen kayıtsız yaklaşımı hakkında beğenilmeyen çok şey var. Ancak üst düzey görüntü oluşturma, iyi yazma ve bazen parıldayan sohbetiyle ChatGPT, paranızın karşılığını en iyi şekilde veriyor. Veya hiç para harcamak istemiyorsanız, Gemini 2.5 Pro çoğu kullanım durumu için çok, çok güçlü; sadece bir Google aramasında gördüğünüz yapay zeka o kadar iyi değil diye Google’ı göz ardı etmeyin.

İnsanlar (şimdilik). Son birkaç aydır, biraz ürkütücü bir alışkanlık geliştirdim: yapay zekaların işimi alıp alamayacağını kontrol etmek. Onlara belirli bir Future Perfect bülteninin temelini oluşturan araştırma notlarını veriyorum, örnek olarak birkaç Future Perfect bülteni veriyorum ve benden işimi yapmalarını istiyorum. Her zaman titrek bir şekilde "enter" tuşuna basıyorum. Sonuçta, yapay zekalar Future Perfect bültenini yazabildiğinde, Vox neden benim işimi yapmam için bana ödeme yapsın? Neyse ki, hiçbiri yapamıyor: ne Grok 3, ne Gemini 2.5 Pro, ne DeepSeek, ne Claude, ne de ChatGPT. Bültenleri rahatlatıcı bir şekilde vasat. Kötü değil, ancak o kadar kötü ki, eğer onlardan birini gönderseydim, editörüm en iyi halimde olmadığımı fark ederdi ve bu tüm araştırma notlarımla birlikte! Metaforlardan birkaçı başarısız oluyor, bazı yan notlar kafa karıştırıcı ve bazen açıklamadığı bir referans ekliyor.

Ancak işimi alması için bir robot seçmek zorunda kalsaydım, sanırım Gemini 2.5 Pro’ya verirdim. Editörüm oyunumdan uzaklaştığımı fark ederdi, ancak dürüst olmak gerekirse, o kadar da bariz değil. Ve benden farklı olarak, botlar sağlık sigortası, maaş, aile zamanı veya uyku gerektirmiyor. Bunun ne anlama geldiği konusunda endişeli miyim? Evet, kesinlikle.

RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Most Popular