Haberler

Evde > Haberler >

hakkında şirket haberleri Homsh's Çığır Açan Gelişmesi: ViT+ArcFace Göz Tanımasında %0,29 EER Elde Etti

Etkinlikler

Davalar

İletişim

İletişim: Mr. Kelvin Yi

Tel: 65-80381900

Şimdi iletişime geçin

Bize e-posta gönderin.

Homsh's Çığır Açan Gelişmesi: ViT+ArcFace Göz Tanımasında %0,29 EER Elde Etti

2026-04-01

Homsh'nin Çığır Açan Gelişmesi: ViT+ArcFace

İris tanıma doğruluğu dünya lideri seviyesine ulaştı
Sadece %0,29 Eşit Hata Oranı (EER) ve teorik sınıra yaklaşan ROC AUC ile —
Vision Transformer ile iris tanıma sınırlarını yeniden tanımladık

▲ Vision Transformer, iris özellik çıkarımının temel paradigmasını yeniden tanımlıyor

I. Bu Sefer Sadece İlerleme Değil — Bir Paradigma Kayması

İris tanıma alanında yirmi yıldır çalışan bir mühendise sorsanız: "Üstesinden geldiğiniz en zor problem neydi?"

Muhtemelen bir an duraksar ve şöyle der: "Lastik Levha."

John Daugman'ın 1993'te IrisCode algoritmasını önermesinden bu yana, "Lastik Levha açma" süreci dünya çapındaki iris tanıma sistemlerinin DNA'sına kazınmış bir tılsım gibiydi. Dairesel irisi dikdörtgen bir görüntüye açmak, ardından Gabor filtreleri kullanarak dokuları çıkarmak... bu iş akışı otuz yıldır kullanılıyordu ve kimse sorgulamadı.

Ta ki biz onu atmaya karar verene kadar.

II. Lastik Levha Neden İşe Yaramaz Hale Geldi?

Vision Transformer (kısaca ViT), son üç yılda derin öğrenme alanındaki en göz kamaştırıcı teknolojik gelişmelerden biridir. Bir görüntüyü 16x16'lık bir dizi "yama"ya böler, görüntünün küresel yapısını anlamak için dil modellerinin kendi kendine dikkat mekanizmasını kullanır ve yıllarca hakim olan evrişimli sinir ağlarını (CNN'ler) birden fazla üst düzey görsel görevde geride bırakır.

ViT'yi ilk kez iris tanımaya uygulamaya çalıştığımızda, ilk sonuçlar hayal kırıklığı yarattı: Eşit Hata Oranı (EER) %4,65 gibi yüksek bir orandaydı, beklentilerin çok altındaydı.

Ekip hızla temel nedeni belirledi: Lastik Levha, 64x512 piksel halka şeklindeki irisi, ViT'nin gerektirdiği 224x224 girişine ölçeklenen bir dikdörtgene "düzleştirir" — bu, 3,5 kat dikey gerilme ve 2,3 kat yatay sıkıştırma anlamına gelir. İrisin doğal radyal/çevresel doku yapısı ciddi şekilde bozulmuştu, bu da ViT'nin yama dikkat mekanizmasının içindeki anlambilimi algılamasını imkansız hale getiriyordu.

Başka bir deyişle: En akıllı modele yanlış şekilde veri besliyorduk.

Çözüm basit görünüyor, ancak geleneği kırma cesareti gerektiriyordu — Lastik Levha'yı terk etmek ve ROI dairesel kırpmaya geçmek: irisin merkezini orijin alarak, irisin doğal uzamsal simetrisini korumak için kare bir alan (yarıçapın 2,5 katı) kırpın, ardından doğrudan 224x224'e yeniden boyutlandırıp ViT'ye besleyin. Bu şekilde, her 16x16 yama otantik, bozulmamış iris dokusunu algılayabilir.

III. Anahtar Metrikler: EER = %0,29, ROC AUC = 0,9999

Bu tek ön işleme adımını değiştirmek büyük bir fark yarattı:

Çözüm	EER	Notlar
Tur 1: ViT + Lastik Levha	4,65%	Geleneksel iş akışı
Tur 2: CNN + Lastik Levha	2,80%	Sınırlı iyileştirmeyle omurga değişimi
Tur 3: ViT + ROI Kırpma	~%0,12*	Kritik atılım
Son Sürüm: ViT-S/16 + ROI + Düzenlileştirme	0,29%	Üretim sınıfı çözüm

*Tur 3 sonuçları titiz istatistiksel doğrulamaya tabi değildir ve iyimser yanlılık içerir.

Son yayınlanan sistem, 8 genel veri kümesinin birleşiminden (toplam 4.480 kimlik / 67.704 görüntü) eğitilmiş ViT-S/16'yı (22,1M parametre) + ArcFace açısal marj kaybını benimser. Titiz istatistiksel doğrulamanın ardından sonuçlar aşağıdaki gibidir:

● EER = %0,29 (Eşit Hata Oranı)

● %95 Güven Aralığı: [%0,21, %0,40] (200 Bootstrap yeniden örnekleme turu)

● ROC AUC = 0,9999 (neredeyse mükemmel puan)

● Ortalama gerçek çift benzerliği: 0,8742 (aynı birey için yüksek tutarlılık)

● Ortalama sahte çift benzerliği: 0,0450 (farklı bireyler için tam özellik ayrımı)

● FRR=%1 iken, FAR = %0,00 (yüksek güvenlikli çalışma noktalarında sıfır yanlış tanıma)

▲ ROC Eğrisi (AUC=0,9999) ve Gerçek/Sahte Puan Dağılımı — İki Tepe Tamamen Ayrılmış Durumda

IV. Eğitim Verileri: Sadece Büyük Değil, Çeşitli

Bu çalışma, sektördeki en zorlu iki senaryo dahil olmak üzere 8 genel veri kümesini birleştirdi:

İkiz Verileri (CASIA-Iris-Twins)

200 ikiz çiftinden alınan iris verileri — neredeyse aynı genlere sahip olsalar bile, iris dokuları tamamen farklıdır. Bu, algoritmanın ayırt edici gücünü doğrulamak için "nihai test"tir.

Görünür Işık Kısıtlamasız Senaryolar (UBIRIS.v2)

Doğal aydınlatma altında hareket bulanıklığı, odak dışı bozulma ve aydınlatma değişiklikleriyle yakalanan 518 kimliğe ait 11.000'den fazla görüntü — bu, gerçek dünya dağıtım senaryolarına en yakın veri kümesidir.

Eğitim, Apple Silicon M2 Ultra (Mac Studio) üzerinde yaklaşık 12,3 saatte (90 eğitim dönemi) tamamlandı ve zirve çıkarım gecikmesi yalnızca ~35ms'dir (ROI kırpma ve özellik çıkarma dahil).

V. En İyi Sektör Çalışmalarıyla Yatay Karşılaştırma

Yöntem	Omurga	Ön İşleme	EER
Daugman IrisCode	Gabor	Lastik Levha	~%0,10 (Kontrollü Ortam)
UniqueNet (2016)	Siamese CNN	Lastik Levha	0,18%
IrisFormer (2023)	ViT-B/16	Lastik Levha	0,22%
PolyIRIS (2021)	Çok Ölçekli CNN	Lastik Levha	(Tek Veri Kümesi)
Homsh ViT+ArcFace (Bu Sürüm)	ViT-S/16	ROI Kırpma	0,29% (8 Veri Kümesi)

▲ %4,65'ten %0,29 EER'ye: Dört Tur İterasyonun Teknolojik Evrim Yolu

VI. Sonraki Adımlar

1. Veri Kümesi Bağımsız Değerlendirme

Gerçek dünya genelleme yeteneğini doğrulamak için eğitime dahil edilmeyen IIT Delhi veri kümesi üzerinde kör test.

2. Canlılık Tespiti Entegrasyonu

Fotoğraf oynatma saldırılarına karşı savunmak ve eksiksiz bir sahtecilik önleme sistemi oluşturmak için çoklu kare flaş yanıtı veya doku analizi birleştirme.

3. Orta ve Uzun Menzilli İris Tanıma
Daha büyük yakalama mesafelerine sahip senaryolara genişletmek için orta menzilli (3m) verileri tanıtma — ticari uygulama için bir sonraki mavi okyanus.

4. Hafifletme ve Kenar Tarafı Dağıtımı
Kaynak kısıtlı kenar cihazlarına (NPU/FPGA) uyum sağlamak için ViT-S/16 modelini <5M parametreye damıtma.

Sonuç: Otuz Yıllık Bir Gelenek Yeniden Gözden Geçirilmeyi Hak Ediyor

Daugman'ın Lastik Levha'sı kendi döneminin en iyi çözümüydü. Ancak teknolojinin özü şudur: daha iyi araçlar ortaya çıktığında, eski paradigma kenara çekilmelidir.

Vision Transformer, görüntü tanıma mantığını değiştirmiştir. Dört tur deney ve dört aylık keşif yoluyla, ViT'nin iris tanımada potansiyelini gerçekten ortaya çıkarması için doğru yolu bulduk — ViT'yi eski iş akışına uyarlamak değil, ViT için özel olarak tasarlanmış yeni bir ön işleme paradigması tasarlamak.

%0,29'luk bir EER sadece bir sayıdır, aynı zamanda bir beyandır:

İris tanıma Transformer çağına girdi ve Homsh başlangıç çizgisinde.

Homsh Hakkında

2011 yılında kurulan WuHan Homsh Technology Co., Ltd. (HOMSH), çekirdek iris tanıma algoritmaları ve çiplerinin bağımsız fikri mülkiyet haklarına sahip dünyadaki az sayıdaki yüksek teknoloji şirketinden biridir. Çekirdek Phaselirs™ algoritması ve iris tanıma için Qianxin Serisi FPGA/ASIC akıllı çipler, finansal toplama, gümrük işlemleri, devlet sertifikası verme, askeri güvenlik ve diğer alanlarda yaygın olarak kullanılmaktadır.

Haberler

Davalar

Homsh's Çığır Açan Gelişmesi: ViT+ArcFace Göz Tanımasında %0,29 EER Elde Etti

I. Bu Sefer Sadece İlerleme Değil — Bir Paradigma Kayması

II. Lastik Levha Neden İşe Yaramaz Hale Geldi?

III. Anahtar Metrikler: EER = %0,29, ROC AUC = 0,9999

IV. Eğitim Verileri: Sadece Büyük Değil, Çeşitli

V. En İyi Sektör Çalışmalarıyla Yatay Karşılaştırma

VI. Sonraki Adımlar

Sonuç: Otuz Yıllık Bir Gelenek Yeniden Gözden Geçirilmeyi Hak Ediyor

Homsh Hakkında

İris Tanıma Modülü

İris Tarayıcı Modülü

İris Kamera Modülü

İris Yakalama Cihazı

İris Erişim Kontrolü

Iris Sınır Kontrolü

İris Tarayıcı Kapı Kilidi