Yapay Zekâ

UNITE AI Modeli Yüzlere Bağlı Olmadan Herhangi Bir Deepfake’i Tespit Edebilir

mm
Analyzing a video frame for deepfakes

Bilim insanları artık AI sorununu AI ile çözmeye çalışıyor. UC Riverside’dan araştırmacılar, derin sahte videoların ciddi sorununu ele almak için UNITE modelini yarattı. 

“İnsanlar, gördüklerinin gerçek olup olmadığını bilme hakkına sahiptir,” dedi UCR’nin Marlan ve Rosemary Bourns Mühendislik Fakültesi’nden doktora adayı Rohit Kundu, “Towards a Universal Synthetic Video Detector: From Face or Background Manipulations to Fully AI-Generated Content.”1 “Ve AI gerçekliği taklit etmede ne kadar iyi olursa, gerçeği ortaya çıkarmada o kadar iyi olmamız gerekiyor.”

Araştırmacılar, Alphabet şirketi Google’dan bilim insanlarıyla iş birliği yaparak video manipülasyonlarını tespit eden ve sahte içeriği ortaya çıkaran yeni bir AI modeli geliştirdi; bu içerik dezenformasyon yaymak ve zarara yol açmak için kullanılıyor. Çalışma şu şekilde belirtti:

“Yanlış bilginin hızlı yayılması, özellikle seçim gibi kritik dönemlerde, yüz, arka plan ve insan konulu/konusuz tam AI‑tarafından üretilen T2V/I2V içeriği dahil olmak üzere çeşitli manipülasyonları tanımlayabilen genelleştirilebilir tespit modellerine duyulan ihtiyacı vurgulamaktadır.”

Model, kısmen manipüle edilmiş ve tamamen sentetik videoları tespit edebiliyor. Çoğu geleneksel tespit cihazının sadece yüze odaklanmasının aksine, bu model videolarda insan konusu olup olmadığına bakılmaksızın tüm çerçeveleri analiz ediyor. 
Bu, doğrulayıcılar, eğitimciler, editörler, sosyal medya platformları ve diğerleri tarafından düzenlenmiş videoların viral olmasını önlemek için kullanılabilecek güçlü bir araç haline getiriyor.

Yapay Zekânın Yükselişi ve Ortaya Çıkan Sentetik Aşırı Yük

Veri parçacıkları gibi yüzen hipergerçek yüzler/görsellerle dolu kalabalık bir dijital alan.

Yapay Zeka (AI), hayatımızın ve işimizin çeşitli yönlerini devrim niteliğinde değiştirme konusunda muazzam bir potansiyele sahiptir.

Bu teknolojinin otomasyon, veri analizi ve karar verme konusundaki yetenekleri zaten endüstrileri dönüştürmeye başladı ve bu on yılın sonuna kadar küresel ekonomiye trilyonlarca dolar eklemesi bekleniyor.

Bir çalışma, pazar tahminleri devi IDC’nin tahminlerine göre, AI’nın yükselişinin 2030 yılına kadar küresel ekonomiyi toplam 19,9 trilyon dolar artıracağını öngörüyor.

McKinsey araştırması ise, jeneratif AI’nın eklediği değerin, küresel yönetim danışmanlığı firması tarafından analiz edilen 63 kullanım durumunda $4.4 trilyon olabileceğini öngörüyor. AI’nın sağlayabileceği değerin yaklaşık %75’i sadece dört alanda gerçekleşecek:

  • Ar-Ge
  • Yazılım Mühendisliği
  • Pazarlama ve Satış
  • Müşteri Operasyonları

Teknoloji etkisinin tüm sektörlerde önemli olması öngörülürken, teknoloji ve bankacılık, gelirlerinin gen AI’dan gelen yüzdesi açısından en fazla etkiyi görebilir. Goldman Sachs da aynı görüşte, AI’dan küresel GSYİH’de %7 artış bekliyor. Bankanın ekonomistleri Joseph Briggs ve Devesh Kodnani, o zaman belirtti:

“Jeneratif AI’nın potansiyeliyle ilgili önemli belirsizliklere rağmen, insan tarafından oluşturulan çıktıya ayırt edilemez içerik üretme ve insanlar ile makineler arasındaki iletişim engellerini kaldırma yeteneği, büyük makroekonomik etkileri olabilecek önemli bir ilerlemeyi yansıtıyor.”

Ancak, öğrenme, problem çözme ve karar verme gibi genellikle insan zekâsı gerektiren görevleri yerine getirme yeteneği, dünyayı sarsmaya hazırlanırken aynı zamanda kaosa sürüklüyor.
Teknoloji ne kadar sofistike hale geliyorsa, gerçek ile sahte arasındaki çizgi o kadar belirsizleşiyor.

Neden Eski Deepfake Algılayıcıları Artık Çalışmıyor

Şirket Araç Algılama Odak Noktası Sınırlamalar
UC Riverside + Google UNITE Tam çerçeve (yüz, arka plan, T2V/I2V) Henüz geliştirme aşamasında
Microsoft Video Authenticator Yüz tabanlı manipülasyonlar Modern jeneratif AI’ye kıyasla eski
Intel FakeCatcher Fizyolojik sinyallerle özgünlük Yüksek kaliteli yüz görüntüsü gerektirir
OpenAI Text Watermarking Metin tabanlı AI çıktısı Görsel içerik için sınırlı
Google SynthID AI tarafından oluşturulan filigran tespiti Sadece Google AI modelleriyle çalışır

Son birkaç yılda, AI’daki ilerlemeler sentetik medyada benzeri görülmemiş bir artışa yol açtı. Tahminler, öneriyor ki daha uzun LinkedIn gönderilerinin yarıdan fazlası şu anda AI tarafından yazılıyor. Ardından ‘AI slop’ var; bu, düşük kaliteli, kitlesel üretilen AI‑tarafından oluşturulan içeriği ifade eder.

Ancak en kaygı vereni, AI kullanılarak oluşturulan veya değiştirilen görüntüler, videolar veya ses kayıtları olan deepfake’lerdir. AI’ı kullanarak sahte bir temsili gerçekçi gösteren sahte içeriklerdir.

Bugün, bu tür içerik her yerde, internetin her köşesine nüfuz ediyor. Bu hipergerçekçi dijital medya karışıklığa yol açıyor ve yanlış bilgi yayıyor. Aynı zamanda insanların gizliliği ve güvenliği için bir tehdit oluşturuyor.

Siber suçlular, AI’ı kullanarak oyunlarını yükseltiyor, aldatıcı e‑posta saldırıları ve kimlik hırsızlıkları yapıyor. Kundu’ya göre:

“Bu araçların bu kadar erişilebilir olması korkutucu. Orta seviyede becerisi olan herkes güvenlik filtrelerini aşabilir ve kamu figürlerinin asla söylemedikleri şeyleri söylediği gerçekçi videolar üretebilir.”

Bu tür bir olayda, siber suçlular bir Zoom toplantısında şirketin mali sorumlusuna (CFO) büründü ve 25 milyon dolar kayba yol açtı.

Bu sadece bir başlangıç, çünkü Deloitte, bu tür olaylardan kaynaklanan dolandırıcılık kayıplarının 2027’ye kadar ABD’de 40 milyar dolara ulaşacağını, 2023’teki 12,3 milyar dolardan artacağını öngörüyor. Bir ABD Hazine raporu da firmalar tarafından benimsenen “mevcut risk yönetimi çerçevelerinin” yeni ortaya çıkan AI teknolojilerini kapsamak için yeterli olmayabileceğini buldu.

Bu, AI içeriğini tespit etmeye ve teknolojinin risklerine karşı korunmaya yardımcı araçların olmadığı anlamına gelmez. Aslında piyasada birçok araç mevcut.

Yeni içerik oluşturmayı kolaylaştıran yeni AI araçlarını piyasaya süren aynı şirketler, sentetik verileri tespit etmeye yardımcı yollar da sunuyor.

2020’de, teknoloji devi Microsoft (MSFT ) duyurdu bir Video Authenticator’ı, sabit fotoğraf veya videoyu analiz ederek medyanın yapay olarak manipüle edilip edilmediğini belirlemek için bir güven skoru sağlamasını. Araç, deepfake’in karışım sınırını ve insan gözünün fark edemeyebileceği ince solukluğu tespit ederek çalışıyor.

O dönemde, sahte içeriği tanımlamak ve insanların etkileşimde bulunduğu medyanın özgünlüğünü doğrulamak için bir teknoloji de tanıttı. İçeriğe dijital hash’ler ve sertifikalar eklemeyi sağlayan bir araç içeriyordu; bu hash’ler meta veri olarak içinde bulunuyordu. Öte yandan, bir okuyucu sertifikaları kontrol etmek ve içerik özgünlüğü için hash’leri eşleştirmek üzere tanıtıldı.

Teknoloji devi, AI destekli çağda bu teknolojinin kısa vadeli faydalarına dair uyarıda bulundu. Deepfake’ler sürekli öğrenen AI tarafından üretildiği için, geleneksel tespit yöntemlerini aşmaları sadece zaman meselesidir.

Aynı dönemde, Facebook, bir Meta (META ) şirketi, araştırmacıların daha önce erişemediği verileri kullanarak bir yarışma başlattı.

Birkaç yıl önce, Intel (INTC ) bir FakeCatcher geliştirdi; bu, gerçek zamanlı deepfake tespit cihazı, %96 doğruluk oranına sahip olduğunu iddia ediyor.

Araç, yüz ve işaret noktası tespit algoritmaları için AI modellerini çalıştırmak amacıyla OpenVino’yu kullandı, aynı zamanda bilgisayarlı görme blokları Entegre Performans Primitifleri ve OpenCV ile optimize edildi. Donanım açısından, platform 3. nesil Xeon® Scalable işlemcilerinde aynı anda yetmişten fazla farklı tespit akışı çalıştırabiliyor.

Yanlış olanı bulmaya çalışmak yerine, FakeCatcher insanı neyin oluşturduğunu değerlendirerek otantik ipuçları arar ve ardından algoritmalar bu sinyalleri uzamsal-zamansal haritalara dönüştürür; sonunda derin öğrenme kullanarak bir videonun gerçek mi sahte mi olduğunu anında tespit eder.

Geçen yıl, OpenAI ayrıca içerik özgünlüğüne yardımcı araçlar araştırtığını duyurdu.

Bu, metin filigranlamasını içeriyor; OpenAI, bunun yerel manipülasyonlara karşı etkili olduğunu, ancak küresel manipülasyonlara karşı o kadar etkili olmadığını belirtti. Ayrıca, bunun “İngilizce’yi ana dili olmayan grupları” orantısız bir şekilde etkileyebileceğini söyledi.

Bu güncelleme, Wall Street Journal’ın raporlamasından sonra geldi; şirketin zaten bir araç geliştirdiği, bu aracın ChatGPT tarafından üretilen metni “yüksek doğruluk” ile filigranladığını ve tespit ettiğini, ancak henüz yayınlamaya karar vermediğini belirtti.

Ayrıca, OpenAI, dijital içerik sertifikasyonu için yaygın olarak kullanılan bir standart olan C2PA (İçerik Kökeni ve Özgünlüğü Koalisyonu) Yürütme Komitesine katıldı. Şirket, hizmetlerinin oluşturduğu ve düzenlediği tüm görsellere C2PA meta verilerini ekliyor; bu, görüntü tespit araçlarının bir parçası.

Şu yıl, Google da kendi AI tarafından oluşturulan metin, görüntü, ses ve video tespit aracı olan SynthID Detector‘ı geliştirdi.

Google’ın aracı ise yalnızca, teknoloji devinin kendi AI hizmetleri (Gemini, Imagen, Veo ve Lyria gibi) kullanılarak üretilen içeriklerde çalışıyor. Bunun nedeni, aracın temelde Google ürünlerinin çıktısına gömülü bir “filigran” varlığını tespit etmesidir.

Filigran, içeriğe gömülmüş benzersiz, makine tarafından okunabilir bir öğedir. İnsanlar tarafından tanınamayan bu öğe, bu amaçla oluşturulmuş algoritmalar tarafından tespit edilebilir ve çıkarılabilir.

UNITE’in Çığır Açan Teknolojisinin İçinde

Tam bir video çerçevesini analiz eden bir bilgisayar görme sistemi

Dolayısıyla, AI teknolojisi hızla ilerledikçe, bu teknolojiyle üretilen içeriği tespit eden araçlar da gelişiyor. Ancak tüm AI içerik türlerinde herkes tarafından kullanılabilecek evrensel bir araç yok.

Ayrıca, mevcut deepfake tespit tekniklerinin odak noktası özellikle dudak senkronizasyonu veya yüz takası gibi yüz manipülasyonlarıdır ve teknoloji ilerledikçe bu yöntemler yetersiz kalmaktadır.

Teknolojik yenilikler, metinden videoya (T2V) ve görüntüden videoya (I2V) jeneratif modellerde önemli ilerlemeler kaydettikçe, artık herkesin son derece inandırıcı, tamamen AI tarafından üretilen sentetik içerik ve sorunsuz arka plan değişiklikleri oluşturması mümkün. Bu, elbette, bireylerden kurumlara ve hatta ülkelere ciddi riskler getiriyor.

Bu bağlamda, önceki deepfake algılayıcıların tamamen yüze bağımlı olması, günümüzün daha teknolojik olarak gelişmiş dünyasında onları eski moda kılıyor. 

“Çerçevede yüz yoksa, birçok algılayıcı basitçe çalışmaz. Ancak dezenformasyon birçok biçimde gelebilir. Bir sahnenin arka planını değiştirmek de gerçeği aynı derecede çarpıtabilir.”

– Kundu

Dolayısıyla, geleneksel algılayıcılar yeni manipülasyonlarda çalışmaz; çünkü yeni sentetik içerik artık tam sahneler ve arka planlar içerdiğinden, yüz odaklı tespit yöntemlerine meydan okur.

Bu, daha çok yönlü bir yaklaşım gerektirir. Bu soruna çözüm olarak, UC Riverside araştırmacıları UNITE’i tanıttı.

Tam Çerçeve Manipülasyonlarını Tespit Eden Evrensel Ağ (UNITE) modeli, tam çerçeve manipülasyonlarını yakalar.

“Deepfake’ler evrim geçirdi,” dedi Kundu, UC Riverside’da temel modelleri gelişmiş görsel görevler için, görüntü segmentasyonu ve sahte medya tespiti dahil, kullanmaya odaklanan. “Artık sadece yüz takasıyla sınırlı değiller. İnsanlar tamamen sahte videolar oluşturuyor – yüzlerden arka planlara kadar – güçlü jeneratif modeller kullanarak. Sistemimiz, bunların tümünü yakalayacak şekilde inşa edildi.”

Model, yüzlerin veya insan konularının olmadığı senaryolara tespit yeteneklerini genişletiyor ve ayrıca ince uzamsal ve zamansal tutarsızlıkları tanımlayabiliyor; hatta önceki sistemlerin kaçırdığı karmaşık arka plan değişikliklerini de kapsıyor.

Dolayısıyla, yüzleri, arka planı ve hareket desenlerini inceleyerek, tam video çerçevelerini kapsayan UNITE, yalnızca yüz içeriğine dayanmayarak sentetik videoları tespit eden ilk araçlardan biri sunuyor.

Bunun için model, çoklu başlıklı dikkat mekanizmasıyla sıralı verileri işleyen bir transformer tabanlı derin öğrenme modelini kullanıyor. Burada metin, token adı verilen sayısal temsillere dönüştürülür. Bu mimari, GPT gibi birçok modern dil modelinin temeli niteliğindedir.

Bilgiyi paralel işleyerek, transformer’lar daha hızlı eğitim ve geliştirilmiş performans sağlayabilir.

UNITE durumunda, transformer tabanlı mimari, videolardan SigLIP-So400M temel modeli aracılığıyla çıkarılan alan bağımsız özellikleri işler. Temel AI çerçevesi SigLIP, belirli bir nesneye veya kişiye bağlı olmayan özellikleri çıkarır.

Hem yüz/arka plan hem de metinden videoya/görüntüden videoya içerik değişikliklerini kapsayan sınırlı veri setleri nedeniyle, ekip modelleri için yenilikçi eğitim stratejileri kullandı. Bu, görevle alakasız verileri standart deepfake verileriyle birlikte eğitmeyi ifade ediyor.

Dolayısıyla, popüler FaceForensics++ veri setine ek olarak, ekip SAIL-VOS-3D veri setini de kullandı; bu veri seti karmaşık ortamları simüle eder ve AI tespit modellerinin eğitimi için çeşitli sentetik sahneler sunar. Dikkat çekici bir şekilde, bu veri seti başlangıçta GTA-V oyununda 3D video nesne segmentasyonu için tasarlanmıştı. AI tarafından üretilmemiş olsa da, veri seti tamamen sentetiktir ve bu nedenle AI tarafından üretilen medyayı simüle etmeye yardımcı olur. Ekip, bunun modelin çeşitli sentetik manipülasyonları tespit etme yeteneğini artırdığını buldu.

Google, modeli eğitmek için gerekli veri setlerine ve hesaplama kaynaklarına erişim sağladı.

Modelin yüze aşırı odaklanma eğilimini azaltmak için ekip, video çerçeveleri boyunca çeşitli uzamsal dikkatleri teşvik eden bir attention-diversity (AD) kaybı kullandı.

AD kaybı, sınıflandırma modelinin performansını ölçmek için yaygın olarak kullanılan ve log kayıp fonksiyonu olarak da bilinen çapraz entropi ile birleştirildi; bu, modelin çeşitli durumlarda performansını artırmak içindir.

​Sadece çapraz entropi (CE) kaybı ile modeli eğitmek, gerçek bir insan konulu ancak manipüle edilmiş arka planlı videoları veya T2V ve I2V modelleri tarafından üretilen içeriği ele almasını zorlaştırır.

Bu nedenle, ekip AD kaybını tanıttı; bu, sistemin her çerçevede birden fazla görsel bölgeyi izlemeye yönelerek ön plan ve arka plandan önemli işaretleri yakalama yeteneğini artırmasını sağlar.

AD kaybı, ekibin yaklaşımındaki temel yenilik olarak işaretleniyor; UNITE’in yalnızca AI tarafından üretilen ve arka planı değiştirilmiş videoları tespit etmede mükemmel olmasını sağlamakla kalmayıp, aynı zamanda yaygın yüz manipülasyonlu içeriği tanımlamadaki belirgin iyileşmeyi de getiriyor.

UNITE’in performansını diğer modellerle karşılaştırdıklarında ekip, UNITE’in yüz/arka plan manipülasyonları ve tam sentetik T2V/I2V videolarını içeren veri setlerinde (çapraz veri ayarlarında) en son teknoloji algılayıcıları geride bıraktığını, uyarlanabilirliğini ve genelleştirilebilir tespit yeteneklerini gösterdiğini buldu.

Giderek dijitalleşen ve otomatikleşen bir dünyada, yeni sistem basit yüz takaslarından karmaşık, gerçek görüntü içermeyen tamamen sentetik videolara kadar bir dizi sahteyi işaretleyebilen evrensel bir algılayıcı sunuyor. Kundu’ya göre:

“Tüm bu senaryoları yöneten tek bir model. Bu da onu evrensel kılıyor.”

Şu anda geliştirilmekte olan UNITE, yaratıcılarına göre gelişen sentetik video tespit ortamında değerli bir araç. Yakında, video dezenformasyonuna karşı savunmada kilit bir rol oynaması bekleniyor.

AI Tabanlı Tespit Yatırımları

AI alanında, Palantir Technologies (PLTR ) AI destekli veri entegrasyonu, desen tanıma ve anomali tespitiyle tanınır. 
Şirket, dört ana yazılım platformu üzerinden faaliyet gösterir: Gotham, Foundry, Apollo ve AIP. Apollo, kritik sistemlerin sürekli çalışmasını sağlamak için yapılandırma, güvenlik güncellemeleri ve yeni özelliklerin teslimini koordine eden tek bir kontrol katmanıdır. Gotham, kullanıcıların veri setlerinin derinliklerinde gizli desenleri tanımlamasını sağlar; Foundry ise etkili varlık ve risk yönetimi için işletim sistemi görevi görür. AIP, firmaların LLM’leri ve diğer modelleri tam kontrolle çalıştırmasını sağlar.

Palantir Technologies (PLTR )

Palantir, ABD hükümeti, askeri ve istihbarat ajanslarıyla derin bağlara sahiptir. Bu yıl, kazanarak göç kayıtlarına AI analizi getirmek için 30 milyon dolarlık bir sözleşme aldı.

372 milyar dolar piyasa değerine sahip PLTR hisseleri şu anda 157,72 dolar seviyesinde işlem görmekte; AI talebi, büyük perakende ilgisi ve genişleyen hükümet sözleşmeleri sayesinde yıllık %109,35 artış gösterdi. EPS (TTM) 0,23, P/E (TTM) ise 687,90.

(PLTR )

Finansal olarak, Palantir 2025 1. çeyrekte geliri %39 artarak 884 milyon dolar oldu. ABD geliri ise %55 artarak 628 milyon dolar; bu, 255 milyon dolar ABD ticari geliri ve 373 milyon dolar ABD hükümet geliri içeriyor.

Bu dönemde, şirket ABD ticari toplam sözleşme değerinde en yüksek çeyreğini kaydetti; kalan anlaşma değeri 2,32 milyar dolar.

Palantir’in 1Q25 müşteri sayısı yıllık %39 artış gösterdi. GAAP hisse başına kazancı 0,08 dolar, düzeltilmiş EPS 0,13 dolar. Nakit, nakit benzerleri ve kısa vadeli ABD Hazine menkul kıymetleri çeyrek sonunda 5,4 milyar dolar idi.

“AI çağında modern işletmeler için işletim sistemi sunuyoruz. Yazılımımızın benimsenmesinde, özellikle ABD’de, büyük bir dönüşümün ortasındayız.”

– CEO Alexander C. Karp

Palantir Technologies (PLTR) Hisse Senedi Haberleri ve Gelişmeleri

Sonuç

Yapay zekânın ortaya çıkışı, bireylerin ve kuruluşların teknolojiyi giderek daha fazla benimseyerek üretkenliği artırması ve karar verme süreçlerini geliştirmesiyle dünyayı tamamen değiştirdi.

Dünya ekonomisine trilyonlarca katkı sağlaması öngörülse de, AI tehlikelerden muaf değil. Deepfake’ler ve bunların insanları yanlış bilgilendirmek ve dolandırmak için kullanılması, AI’nın yaygın benimsenmesinin en kritik tehlikelerinden biridir. 

Gerçek ile sentetik arasındaki farkı ayırt etmek zorlaştıkça, UNITE gibi araçlar daha da önemli ve acil hale geliyor. Bu genelleştirilebilir AI modeli, sahte içeriğe karşı bir koruma sağladıkça, AI’nın olumsuz etkilerini hafifletebilir ve işimizde ve hayatımızda olumlu etkilerini artırıp keyfini çıkarabiliriz.

Yapay zekâya yatırım hakkında her şeyi öğrenmek için buraya tıklayın.

Referanslar:

1. Kundu, R.; Xiong, H.; Mohanty, V.; Balachandran, A.; Roy‑Chowdhury, A. K.; ve diğerleri. Towards a Universal Synthetic Video Detector: From Face or Background Manipulations to Fully AI‑Generated Content. arXiv ön baskısı arXiv:2412.12278 (2024). https://doi.org/10.48550/arXiv.2412.12278

Gaurav 2017 yılında kripto para birimleri ile ticaret yapmaya başladı ve o günden beri kripto para birimleri alanına aşık oldu. Her şeyden kripto para birimi olan ilgi alanı, onu kripto para birimleri ve blockchain konusunda uzmanlaşmış bir yazar haline getirdi. Yakında kendini kripto para birimi şirketleri ve medya kuruluşları ile çalışırken buldu. Ayrıca büyük bir Batman hayranı.