logo
Mesaj gönder
Wuhan Homsh Technology Co.,Ltd.
Ürünler
Haberler
Evde > Haberler >
hakkında şirket haberleri Homsh's Çığır Açan Gelişmesi: ViT+ArcFace Göz Tanımasında %0,29 EER Elde Etti
Etkinlikler
İletişim
İletişim: Mr. Kelvin Yi
Şimdi iletişime geçin
Bize e-posta gönderin.

Homsh's Çığır Açan Gelişmesi: ViT+ArcFace Göz Tanımasında %0,29 EER Elde Etti

2026-04-01
Latest company news about Homsh's Çığır Açan Gelişmesi: ViT+ArcFace Göz Tanımasında %0,29 EER Elde Etti

      Homsh'nin Çığır Açan Gelişmesi: ViT+ArcFace

      İris tanıma doğruluğu dünya lideri seviyesine ulaştı
      Sadece %0,29 Eşit Hata Oranı (EER) ve teorik sınıra yaklaşan ROC AUC ile —
      Vision Transformer ile iris tanıma sınırlarını yeniden tanımladık
hakkında en son şirket haberleri Homsh's Çığır Açan Gelişmesi: ViT+ArcFace Göz Tanımasında %0,29 EER Elde Etti  0
▲ Vision Transformer, iris özellik çıkarımının temel paradigmasını yeniden tanımlıyor

I. Bu Sefer Sadece İlerleme Değil — Bir Paradigma Kayması

      İris tanıma alanında yirmi yıldır çalışan bir mühendise sorsanız: "Üstesinden geldiğiniz en zor problem neydi?"
      Muhtemelen bir an duraksar ve şöyle der: "Lastik Levha."
      John Daugman'ın 1993'te IrisCode algoritmasını önermesinden bu yana, "Lastik Levha açma" süreci dünya çapındaki iris tanıma sistemlerinin DNA'sına kazınmış bir tılsım gibiydi. Dairesel irisi dikdörtgen bir görüntüye açmak, ardından Gabor filtreleri kullanarak dokuları çıkarmak... bu iş akışı otuz yıldır kullanılıyordu ve kimse sorgulamadı.
      Ta ki biz onu atmaya karar verene kadar.

II. Lastik Levha Neden İşe Yaramaz Hale Geldi?

      Vision Transformer (kısaca ViT), son üç yılda derin öğrenme alanındaki en göz kamaştırıcı teknolojik gelişmelerden biridir. Bir görüntüyü 16x16'lık bir dizi "yama"ya böler, görüntünün küresel yapısını anlamak için dil modellerinin kendi kendine dikkat mekanizmasını kullanır ve yıllarca hakim olan evrişimli sinir ağlarını (CNN'ler) birden fazla üst düzey görsel görevde geride bırakır.
      ViT'yi ilk kez iris tanımaya uygulamaya çalıştığımızda, ilk sonuçlar hayal kırıklığı yarattı: Eşit Hata Oranı (EER) %4,65 gibi yüksek bir orandaydı, beklentilerin çok altındaydı.
      Ekip hızla temel nedeni belirledi: Lastik Levha, 64x512 piksel halka şeklindeki irisi, ViT'nin gerektirdiği 224x224 girişine ölçeklenen bir dikdörtgene "düzleştirir" — bu, 3,5 kat dikey gerilme ve 2,3 kat yatay sıkıştırma anlamına gelir. İrisin doğal radyal/çevresel doku yapısı ciddi şekilde bozulmuştu, bu da ViT'nin yama dikkat mekanizmasının içindeki anlambilimi algılamasını imkansız hale getiriyordu.
      Başka bir deyişle: En akıllı modele yanlış şekilde veri besliyorduk.
      Çözüm basit görünüyor, ancak geleneği kırma cesareti gerektiriyordu — Lastik Levha'yı terk etmek ve ROI dairesel kırpmaya geçmek: irisin merkezini orijin alarak, irisin doğal uzamsal simetrisini korumak için kare bir alan (yarıçapın 2,5 katı) kırpın, ardından doğrudan 224x224'e yeniden boyutlandırıp ViT'ye besleyin. Bu şekilde, her 16x16 yama otantik, bozulmamış iris dokusunu algılayabilir.

III. Anahtar Metrikler: EER = %0,29, ROC AUC = 0,9999

Bu tek ön işleme adımını değiştirmek büyük bir fark yarattı:
Çözüm EER Notlar
Tur 1: ViT + Lastik Levha 4,65% Geleneksel iş akışı
Tur 2: CNN + Lastik Levha 2,80% Sınırlı iyileştirmeyle omurga değişimi
Tur 3: ViT + ROI Kırpma ~%0,12* Kritik atılım
Son Sürüm: ViT-S/16 + ROI + Düzenlileştirme 0,29% Üretim sınıfı çözüm

*Tur 3 sonuçları titiz istatistiksel doğrulamaya tabi değildir ve iyimser yanlılık içerir.

      Son yayınlanan sistem, 8 genel veri kümesinin birleşiminden (toplam 4.480 kimlik / 67.704 görüntü) eğitilmiş ViT-S/16'yı (22,1M parametre) + ArcFace açısal marj kaybını benimser. Titiz istatistiksel doğrulamanın ardından sonuçlar aşağıdaki gibidir:

      EER = %0,29 (Eşit Hata Oranı)

      ● %95 Güven Aralığı: [%0,21, %0,40] (200 Bootstrap yeniden örnekleme turu)

      ● ROC AUC = 0,9999 (neredeyse mükemmel puan)

      ● Ortalama gerçek çift benzerliği: 0,8742 (aynı birey için yüksek tutarlılık)

      ● Ortalama sahte çift benzerliği: 0,0450 (farklı bireyler için tam özellik ayrımı)

      ● FRR=%1 iken, FAR = %0,00 (yüksek güvenlikli çalışma noktalarında sıfır yanlış tanıma)

hakkında en son şirket haberleri Homsh's Çığır Açan Gelişmesi: ViT+ArcFace Göz Tanımasında %0,29 EER Elde Etti  1
▲ ROC Eğrisi (AUC=0,9999) ve Gerçek/Sahte Puan Dağılımı — İki Tepe Tamamen Ayrılmış Durumda

IV. Eğitim Verileri: Sadece Büyük Değil, Çeşitli

Bu çalışma, sektördeki en zorlu iki senaryo dahil olmak üzere 8 genel veri kümesini birleştirdi:

İkiz Verileri (CASIA-Iris-Twins)

      200 ikiz çiftinden alınan iris verileri — neredeyse aynı genlere sahip olsalar bile, iris dokuları tamamen farklıdır. Bu, algoritmanın ayırt edici gücünü doğrulamak için "nihai test"tir.

Görünür Işık Kısıtlamasız Senaryolar (UBIRIS.v2)

      Doğal aydınlatma altında hareket bulanıklığı, odak dışı bozulma ve aydınlatma değişiklikleriyle yakalanan 518 kimliğe ait 11.000'den fazla görüntü — bu, gerçek dünya dağıtım senaryolarına en yakın veri kümesidir.
      Eğitim, Apple Silicon M2 Ultra (Mac Studio) üzerinde yaklaşık 12,3 saatte (90 eğitim dönemi) tamamlandı ve zirve çıkarım gecikmesi yalnızca ~35ms'dir (ROI kırpma ve özellik çıkarma dahil).

V. En İyi Sektör Çalışmalarıyla Yatay Karşılaştırma

Yöntem Omurga Ön İşleme EER
Daugman IrisCode Gabor Lastik Levha ~%0,10 (Kontrollü Ortam)
UniqueNet (2016) Siamese CNN Lastik Levha 0,18%
IrisFormer (2023) ViT-B/16 Lastik Levha 0,22%
PolyIRIS (2021) Çok Ölçekli CNN Lastik Levha (Tek Veri Kümesi)
Homsh ViT+ArcFace (Bu Sürüm) ViT-S/16 ROI Kırpma 0,29% (8 Veri Kümesi)

hakkında en son şirket haberleri Homsh's Çığır Açan Gelişmesi: ViT+ArcFace Göz Tanımasında %0,29 EER Elde Etti  2
▲ %4,65'ten %0,29 EER'ye: Dört Tur İterasyonun Teknolojik Evrim Yolu

VI. Sonraki Adımlar

1. Veri Kümesi Bağımsız Değerlendirme
      Gerçek dünya genelleme yeteneğini doğrulamak için eğitime dahil edilmeyen IIT Delhi veri kümesi üzerinde kör test.
2. Canlılık Tespiti Entegrasyonu
      Fotoğraf oynatma saldırılarına karşı savunmak ve eksiksiz bir sahtecilik önleme sistemi oluşturmak için çoklu kare flaş yanıtı veya doku analizi birleştirme.
3. Orta ve Uzun Menzilli İris Tanıma
      Daha büyük yakalama mesafelerine sahip senaryolara genişletmek için orta menzilli (3m) verileri tanıtma — ticari uygulama için bir sonraki mavi okyanus.
4. Hafifletme ve Kenar Tarafı Dağıtımı
      Kaynak kısıtlı kenar cihazlarına (NPU/FPGA) uyum sağlamak için ViT-S/16 modelini <5M parametreye damıtma.

Sonuç: Otuz Yıllık Bir Gelenek Yeniden Gözden Geçirilmeyi Hak Ediyor

      Daugman'ın Lastik Levha'sı kendi döneminin en iyi çözümüydü. Ancak teknolojinin özü şudur: daha iyi araçlar ortaya çıktığında, eski paradigma kenara çekilmelidir.
      Vision Transformer, görüntü tanıma mantığını değiştirmiştir. Dört tur deney ve dört aylık keşif yoluyla, ViT'nin iris tanımada potansiyelini gerçekten ortaya çıkarması için doğru yolu bulduk — ViT'yi eski iş akışına uyarlamak değil, ViT için özel olarak tasarlanmış yeni bir ön işleme paradigması tasarlamak.
      %0,29'luk bir EER sadece bir sayıdır, aynı zamanda bir beyandır:
      İris tanıma Transformer çağına girdi ve Homsh başlangıç çizgisinde.

Homsh Hakkında

      2011 yılında kurulan WuHan Homsh Technology Co., Ltd. (HOMSH), çekirdek iris tanıma algoritmaları ve çiplerinin bağımsız fikri mülkiyet haklarına sahip dünyadaki az sayıdaki yüksek teknoloji şirketinden biridir. Çekirdek Phaselirs™ algoritması ve iris tanıma için Qianxin Serisi FPGA/ASIC akıllı çipler, finansal toplama, gümrük işlemleri, devlet sertifikası verme, askeri güvenlik ve diğer alanlarda yaygın olarak kullanılmaktadır.