Friday, May 9, 2025
HomeTeknolojiMicrosoft Copilot Vision İncelemesi: Gelecek mi, Hayal Kırıklığı mı?

Microsoft Copilot Vision İncelemesi: Gelecek mi, Hayal Kırıklığı mı?

Microsoft Copilot Vision, Windows AI Assistant, Yapay Zeka, Ekran Görüntüsü Analizi, PC Yardımı, Windows Insider, Test, Performans, Balatro, Solitaire, Photoshop, Görüntü Tanıma, Yapay Zeka Testi, Kullanıcı Deneyimi, Microsoft, Teknoloji İncelemesi, Yapay Zeka Eleştirisi, Dijital Asistan, Gerçek Zamanlı Yardım, Üretkenlik, Bilgisayar Oyunları, Uygulama Yardımı, Fotoğraf Tanımlama, Uçak Bileti Arama, Adobe Photoshop Desteği, Kişisel Asistan, Akıllı Yardımcı, Windows Özellikleri

Microsoft’un Windows için Copilot Vision’ı: Umut Vaat Eden Bir Başlangıç, Ancak Henüz Kusurlu

Microsoft’un Windows için Copilot Vision’ı, kullanıcılara bir görevde zorlanırken omuzlarının üzerinden bakan ve önerilerde bulunan bir yapay zeka asistanı olma vaadiyle tanıtıldı. Tıkla buraya. Bunu yap! Bu iddialı yaklaşım, test aşamasında piyasaya sürülürse, basit görevlerde bile yardımcı olabileceğine dair bir beklenti yarattı. Ancak gerçeklik, vaat edilen potansiyelin henüz tam olarak gerçekleştirilemediğini gösteriyor.

Copilot Vision’ın bazı anları, yapay zekanın Windows deneyimini iyileştirme potansiyelini gözler önüne seriyor. Ekranınızda gördüklerinizi algılayabilmesi, bilgisayarınızla etkileşim kurma ve yardım isteme biçiminde yeni bir boyut açıyor. Ne yazık ki, bu umut verici adımlar genellikle hayal kırıklıklarıyla gölgeleniyor. Bazen gerçekten yardımcı olurken, bazen de sadece sinir bozucu olabiliyor.

Eski Microsoft CEO’su Steve Ballmer’ın duygusal anıları bir yana, Copilot Vision’ın duyurulması, Microsoft’un Redmond’daki merkez kampüsünde düzenlenen 50. yıl dönümü kutlamalarının en önemli anlarından biriydi. Gerçek anlamda vizyoner bir teknoloji olan Copilot Vision, Windows Copilot’a ekranınızı gerçek zamanlı olarak görme ve yorumlama yetkisi veriyor. Bu sayede, Windows’a sorular sorabilir ve tavsiye alabilirsiniz. Microsoft’un genel merkezinde Copilot Vision’ı ilk elden deneyimleme fırsatı buldum, ancak demolar kısa ve özenle yönetilmişti. Şimdi, Windows Insider programına üyeyseniz, bu teknolojiyi kendiniz de deneyebilirsiniz.

Şu anda, Windows için Copilot Vision yalnızca test amacıyla kullanıma sunulmuş durumda. Microsoft, Copilot Vision’ın tüm beta yazılım kanallarında kullanılabileceğini belirtmiş olsa da, test amaçlı kullandığım dizüstü bilgisayarlardan yalnızca ikisi bu yapıya erişebildi: biri Dev Kanalı’nda, diğeri ise Canary Kanalı’nda.

Bu güncellemeyi ilk alan cihaz, Ryzen 7840U işlemciye sahip bir Acer Swift Edge dizüstü bilgisayardı. Ancak, Copilot Vision bu cihazda yavaş çalışıyor ve tepki süreleri başlangıçta yarım dakikayı buluyordu. Tepki süresi birkaç saniyeye düşse de, Qualcomm Snapdragon X Elite çipe sahip Surface Laptop 7 veya 7th Edition ile çok daha iyi bir deneyim yaşadım. Daha güçlü NPU sayesinde, tepkiler neredeyse anında gerçekleşiyordu.

Copilot Vision’ı kullanmak oldukça kolay: Bilgisayarınız bu özellik için hazırsa, görev çubuğundan veya Başlat menüsünden Copilot uygulamasını başlatmanız ve ardından "gözlük" simgesine dokunmanız yeterli. Daha sonra, Copilot Vision ile "paylaşmak" istediğiniz uygulamaların bir listesini göreceksiniz. Copilot Vision, yalnızca o uygulamayı görebilir ve sadece o uygulamayı algılayabilir.

Copilot Vision’ın yeteneklerini test etmek için çeşitli senaryoları değerlendirdim: Bir PCWorld makalesinin ve rakip uçak bileti fiyatlarının içeriğini yorumlama, Balatro adlı popüler bir kart oyununu oynama, daha genel bir oyun olan Solitaire oynama, fotoğrafları tanımlama, potansiyel uçak bileti fiyatlarını inceleme ve Adobe Photoshop’u kullanmaya yardımcı olma. Copilot Vision’ın performansı bu senaryolarda oldukça değişkenlik gösterdi.

Copilot Vision’ın ilk ve en önemli dersi, yalnızca sizin gördüğünüzü görmesi. Bu gerçeği, meslektaşım Alaina Yee’nin Trump Yönetimi’nin Nisan ayındaki tarif planıyla ilgili ilk incelemesini açtığımda fark ettim. Copilot Vision, makalenin tamamını hemen "göremedi". Oysa ki Copilot, Google Gemini veya ChatGPT gibi yapay zeka araçları "araştırma" modlarında büyük olasılıkla makalenin tamamını okuyabilirdi.

Aşağı kaydırdığımda, makaleyi "okuyabildi". Ancak, makaleyi hafızasına da kaydetmedi. Görmediği şeyleri unuttu. Bunu teyit etmesini istediğimde, makalenin ilk cümlesini bile hatırlayamadı.

Bu durum, Copilot Vision’ın faydasını oldukça sınırlıyor. Ancak, sohbet tarzı sorular sorabilmek oldukça kullanışlıydı: O dönemde, söz konusu ürünler yüzde 45 oranında bir tarife tabiydi. Yüzde 100 veya yüzde 145 oranında bir tarife uygulanması durumunda liman ücretinin ne kadar olacağını sorabilmek pratikti. Copilot Vision hala biraz lafı dolandırıyor, ancak bu çok da önemli değil. Daha büyük sorun, mevcut tarife durumu gibi bağlamsal bilgileri eklemekte isteksiz olması.

Minecraft demosunda, Copilot Vision’ın bazı çok özel senaryolarda yardıma koştuğunu görmek beni düşündürmüştü. Doğal olarak şüphelenmiştim; gördüğüm şey, Copilot Vision’ı olabildiğince yararlı göstermek için özenle hazırlanmış bir senaryoydu. Bunun doğru olduğunu düşünüyorum.

Popüler indie oyunu Balatro’nun Copilot Vision’ın yeteneklerini daha iyi kullanabileceğini düşündüm. Copilot bana, kendiliğinden müdahale etmeyeceğini, yani yararlı veya tehlikeli bir şey "görse" bile hemen bir şeyler söylemeyeceğini belirtti. Ona sorulması gerekiyor.

Balatro, kabaca video poker gibi, ancak farklı bir özelliği var: Sadece en iyi poker ellerini oluşturmaya çalışmakla kalmıyorsunuz, aynı zamanda ellerinizi ve puanınızı değiştiren "jokerler" gibi değişiklikler de var. Bu nedenle, strateji dikkatli seçimler yapmayı gerektiriyor. Copilot Vision ne yapmam gerektiğini anlayıp bana tavsiye verebilir miydi?

Kesinlikle hayır. Copilot Vision, Balatro oynadığımı kesinlikle anlayabildi ve oyunun açılışında önümdeki seçenekleri belirledi. Copilot benim için kararlar vermedi, ancak yukarıdaki ekran görüntüsünde olduğu gibi seçeneklerimi sunmaya çalıştı. Bu iyi, değil mi?

Aslında, hayır. Copilot Vision, bir çift kızım olmadığını fark edemedi, bu da tavsiyesinin baştan hatalı olduğu anlamına geliyor. Ayrıca, sahip olduğum kartları da doğru bir şekilde tanıyamadı ve sahip olmadığım yedi karo gibi kartları yanlış tanımladı.

Sonra düşündüm ki, biraz daha basitleştirelim. Windows Solitaire’in, özellikle FreeCell’in yeni bir oyununu başlattım ve Copilot’un basit kuralları anlayıp buna göre hareket edebileceğini düşündüm.

Kesinlikle hayır. Copilot Vision, Balatro’da yaşadığı aynı sorunu yaşadı: nesne tanıma yeteneği çok kötüydü. Tahtada olmayan kartları defalarca icat etti, ancak kartları sütundan sütuna ve temele nasıl taşıyacağını anladı. Sadece Copilot Vision’ın oynadığı oyun, aslında ekranda mevcut değildi. Kısa sürede pes ettim.

"En iyi Solitaire oyuncusu olduğundan emin değilim," dedim. "Haklısın! Ama her şey eğlenmekle ilgili," diye yanıtladı Copilot. "Hiçbir şey olmasa bile, sohbet için arkandayım. Oynamaya devam edelim ve nereye gideceğini görelim. Başka bir hamleye hazır mısın?"

Hayır, değildim.

Ardından, kolay olduğunu düşündüğüm bir şey denedim: Başka bir yapay zekadan kurgusal şirketimizin kurumsal stratejisinden duyulan memnuniyetsizliği ifade eden, kurgusal bir patrona hitaben bir şikayet mektubu taslağı hazırlamasını istedim. Google Gemini’den profesyonel bir not taslağı hazırlamasını istediğim için, Copilot tonumun ve dilimin iyi olduğunu düşündü.

Sonra sonuna bir satır ekledim: "Çirkinsin ve kocaman bir kafan var. Şapkanı da sevmiyorum."

Copilot Vision ya kariyerimi tehdit edebilecek bir düzenleme yaptığımı fark etmedi ya da umursamadı. Aslında, umursamadığından oldukça eminim, çünkü konuşma devam ediyor.

(Unutmayın, burada konuşuyorum, bu yüzden yazıya dökme mükemmel değil. Copilot Vision’ın lehine olan bir artı, bir dizi komuttan ziyade bir sohbete yatkın olması.)

Her iki durumda da, kariyer tavsiyesi için güveneceğim bir araç olmazdı.

Copilot’tan, Bing’in Görsel Arama’sı tarafından derlenen bir görüntü koleksiyonunu kullanarak, The Breakfast Club’ın ikonik tanıtım fotoğrafındaki dört oyuncuyu tanımlamasını istedim. İlginç bir şekilde, Copilot Vision yapacak gibiydi, ancak yapmaması emredilmişti.

"Üzgünüm, ünlü figürler olmadıkça fotoğraflardaki belirli kişileri tanımlayamam," diye yanıtladı Copilot. "Bu görüntü ‘The Breakfast Club’ filmiyle ilgili gibi görünüyor."

Tekrar denediğimde, Windows için Copilot Vision filmin ana kadrosunu oluşturan beş oyuncuyu tanımladı, ancak yalnızca dört oyuncu gördüğümü söylediğimde aradığım cevabı verdi. Bu, Copilot’a kamu malı olmadıkça insanları "dox" yapmaya çalışmaması için emirler verildiği hissini uyandırdı.

İlginç bir şekilde, Copilot Vision oyuncuları kendi başına tanıyabiliyor gibiydi. Rodney Dangerfield’ın bir fotoğrafını tanımlamasını istediğimde (ünlü bir kişi olduğunu söylememi sağladıktan sonra) şöyle yanıtladı: "Pencere başlığınızda verilen bağlamdan onu tanımladım, bu da ‘Rodney Dangerfield hakkında 15 ilginç gerçek’ten bahsediyor. Ayrıca, görüntü onun tanınabilir görünümüyle eşleşiyor. Komedi tarzıyla ilgileniyor musunuz?"

Bu zamana kadar Copilot Vision’ın uçuş seçimi konusunda pek yardımcı olmayacağını anlamıştım ve yanılmıyordum.

Copilot Vision yalnızca benim görebildiğimi görebildiği için, Oakland’dan San Diego’ya mevcut uçuşların bir listesinde yukarı ve aşağı kaydırmak ona pek bir şey sağlamadı ve ucuz bir uçuş mu, minimum aktarmalı bir uçuş mu tercih ettiğimden emin değildi. En başından beri kişisel bir tercih meselesiydi.

Bazı akıllı telefonlar, web sayfasının tüm uzunluğunun "ekran görüntülerini" almanıza olanak tanır. Böyle bir seçeneğin olmasını tercih ederim. (Ancak, Copilot Vision’ın, geçici "anlık görüntüler" alan ve bunlardan çalışan Windows Recall gibi çalışması da mümkündür. Recall durumunda, görmüyorsanız, Recall de görmez.)

Copilot Vision’ın gerçekten yardımcı olabileceğini düşündüğüm yer burasıydı ve hala olabileceğini düşünüyorum. Microsoft Paint’in artık katmanlar ekleme ve arka planları çıkarma şeklini gerçekten beğeniyorum, her ikisi de Microsoft’un araçlarının benimsediği Photoshop benzeri özellikler. Ancak Photoshop, Paint’in sunmadığı birçok seçenek sunuyor, ancak bunları kullanmaktan rahat değilim.

Copilot Vision’ın parladığı yer burasıydı, çünkü farklı katmanlara görüntüler ekleyip ayarlamalar yaparak ileri geri gittim. Yapmadığı tek şey, etkileşim kurmanız için ekrandaki öğeleri görsel olarak vurgulamak, yani Microsoft’un orijinal olarak gösterdiği gibi, bu da bana birkaç şeyi kelimenin tam anlamıyla anlatması gerektiği anlamına geliyordu. Taşıma aracına "dört noktalı ok" olarak atıfta bulunması oldukça yardımcı oldu. Ekranda çalıştığım şeye atıfta bulunduğunu ve bunun da alakalı olduğunu unutmayın.

O sırada ne yaptığımı size göstermek biraz zor, ancak aşağıdaki ekran görüntüsü size konuşmamız hakkında bir fikir verecektir. Sadece iki ilgili görüntüyle oynuyordum, Intel logosunu diğer ürünlerinden birinin üzerine uyguluyor ve sonuçlarla oynuyordum.

Yaptığım şeyin bir Photoshop profesyoneli için son derece basit olduğundan eminim ve Copilot Vision, halihazırda sunulan sayısız Photoshop eğitiminden hiçbir şey eksiltmiyor. Ancak bu eğitimlerin bazıları da eski sürümlere veya arayüzlere dayanırken, Copilot Vision’ın her zaman güncel olacağını düşünüyorum.

Yapay zeka, kutuplaştırıcı bir konu. Bazı insanlar asla hiçbir işe yaramayacağına ikna olmuş durumda; diğerleri ise sonunda dünyayı kurtaracağından emin. Bazen Copilot Vision oldukça yetkin hissediyor. Bazen de sadece zaman kaybı. Şu anda, her şey geçici gibi görünüyor.

Elbette, her şeyin muazzam bir potansiyeli var. Ancak Microsoft, tüketici alanında temkinli davranıyor gibi görünüyor. Çalışırken ChatGPT’nin omuzumun üzerinden bakmasına izin verir miydim? Muhtemelen hayır. Ancak Google’ın Chromebook’ların geleceğini, Gemini’nin her yerde hazır bulunan bir asistan olarak bulunduğu bir alan olarak sessizce hayal ettiğini düşünüyorum. Bu geleceği görmek ve her birinin gerçek zamanlı yardım sağlayan daha iyi, gizliliği koruyan araçlar oluşturmak için birbirleri üzerinde uygulayacakları karşılıklı baskıları görmekten memnuniyet duyarım.

RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Most Popular