سامانه احراز هویت غیرحضوری با OCR و تطبیق اطلاعات هویتی

شرح مسئله و اهداف شرکت برای تعریف پروژه

در فرآیندهای بانکی، مالی و خدمات آنلاین، تأیید هویت کاربر یکی از الزامات حیاتی برای پیشگیری از تقلب، جعل مدارک و سوء‌استفاده از هویت اشخاص است. در بسیاری از سازمان‌ها، احراز هویت هنوز به‌صورت دستی یا نیمه‌دیجیتال انجام می‌شود و کاربران ملزم به مراجعه حضوری یا ارسال تصویر مدارک هستند. این روند علاوه بر کندی و هزینه بالا، مستعد خطای انسانی و جعل است.

فناوری تشخیص نوری کاراکترها (OCR – Optical Character Recognition) همراه با الگوریتم‌های تطبیق هوشمند اطلاعات هویتی، روشی مطمئن برای احراز هویت غیرحضوری خودکار به شمار می‌آید. در این روش، تصویر کارت ملی، شناسنامه یا سایر مدارک رسمی توسط سیستم پردازش شده، داده‌های متنی استخراج می‌شوند و سپس با پایگاه‌های داده رسمی مانند ثبت‌احوال، سامانه سیام یا شاهکار تطبیق داده می‌گردند.

هدف از این پروژه، طراحی و توسعه سامانه‌ای بومی برای احراز هویت غیرحضوری مبتنی بر OCR و تطبیق اطلاعات هویتی است که بتواند خدمات بانکی، پرداخت و دولتی را به‌صورت تمام‌دیجیتال و در لحظه ارائه دهد.

اهداف کلان پروژه عبارت‌اند از:

  • توسعه موتور OCR بومی با دقت بالا برای استخراج اطلاعات از کارت ملی، شناسنامه، گواهینامه و سایر مدارک رسمی.
  • طراحی ماژول تطبیق هوشمند اطلاعات با پایگاه‌های داده ملی (ثبت‌احوال، سیام، شاهکار).
  • افزایش سرعت و دقت فرآیند احراز هویت برای کاربران حقیقی و حقوقی.
  • فراهم‌سازی API و SDK برای بانک‌ها، فین‌تک‌ها و سازمان‌ها جهت استفاده از سرویس در فرآیندهای خود.
  • تضمین امنیت داده‌ها و رعایت الزامات حریم خصوصی در نگهداری و تبادل داده‌های هویتی.

چالش‌های فنی و تخصصی پروژه

  1. دقت در تشخیص متون فارسی در تصاویر متنوع: توسعه الگوریتم OCR بومی برای زبان فارسی با پشتیبانی از فونت‌ها، کیفیت‌های تصویری مختلف و پس‌زمینه‌های پیچیده.
  2. استخراج اطلاعات ساختاریافته از مدارک رسمی: شناسایی فیلدهای کلیدی مانند نام، کد ملی، تاریخ تولد و شماره سریال از کارت‌ها و فرم‌های مختلف با استفاده از Vision AI و Layout Parsing.
  3. تطبیق داده‌ها با پایگاه‌های رسمی: طراحی ماژول تطبیق داده برای تأیید اطلاعات استخراج‌شده با پایگاه ثبت‌احوال، سامانه سیام یا شاهکار از طریق APIهای امن.
  4. تشخیص جعل و اعتبارسنجی تصویر: پیاده‌سازی الگوریتم‌های Forgery Detection برای شناسایی کارت‌های جعلی یا تصاویر ویرایش‌شده.
  5. بهینه‌سازی برای موبایل و وب: توسعه SDK سبک برای استفاده در اپلیکیشن‌های موبایل و وب با کارایی بالا حتی در پهنای باند محدود.
  6. مدیریت امنیت داده‌های هویتی: رمزنگاری داده‌ها با استانداردهای AES و RSA، حذف داده خام پس از استخراج، و ذخیره‌سازی امن قالب‌های متنی.
  7. یکپارچگی با سایر سامانه‌های احراز هویت: طراحی قابلیت اتصال به سامانه‌های احراز بیومتریک برای ارتقای سطح اعتماد در فرآیندهای حساس (Hybrid KYC).
  8. پشتیبانی از انواع اسناد و مدارک: تعریف مدل یادگیری برای پشتیبانی از انواع قالب‌های کارت ملی قدیم، جدید، گواهینامه و سایر مدارک شناسایی متداول.

فازهای عملیاتی پیشنهادی:

  • فاز ۱: مطالعه تطبیقی فناوری‌های OCR جهانی (Tesseract, Google Vision, ABBYY) و تحلیل نیازمندی‌های بومی.
  • فاز ۲: طراحی معماری نرم‌افزار و ماژول‌های OCR، Forgery Detection و Data Matching.
  • فاز ۳: توسعه موتور OCR فارسی و الگوریتم تطبیق داده با پایگاه‌های ملی.
  • فاز ۴: طراحی API و SDK برای فین‌تک‌ها و بانک‌ها.
  • فاز ۵: اجرای پایلوت و تست دقت، امنیت و عملکرد سامانه.

نوآوری محصول نسبت به محصولات مشابه در کشور/شرکت

  1. توسعه موتور OCR بومی فارسی با دقت بالا: بهینه‌سازی برای کارت‌های ملی و مدارک ایرانی با فونت‌ها و قالب‌های متنوع.
  2. یکپارچه‌سازی هم‌زمان با پایگاه‌های داده رسمی: تطبیق خودکار اطلاعات با ثبت‌احوال و سامانه سیام در زمان واقعی.
  3. تشخیص جعل هوشمند: استفاده از مدل‌های یادگیری عمیق برای شناسایی مدارک و تصاویر دستکاری‌شده.
  4. Hybrid KYC (OCR + Biometrics): قابلیت ترکیب احراز هویت متنی با احراز چهره یا اثر انگشت در سطح امنیتی بالاتر.
  5. SDK و API برای ادغام آسان: ارائه ابزار توسعه‌دهنده برای اپلیکیشن‌های موبایل، وب و پلتفرم‌های بانکی.
  6. زمان پردازش کوتاه و دقت بالا: استخراج و تأیید اطلاعات در کمتر از ۲ ثانیه با دقت بالای ۹۸٪.

مقیاس پروژه

مقیاس فنی: در فاز نخست برای بانک‌ها و فین‌تک‌های بزرگ به‌صورت سرویس ابری ارائه می‌شود و سپس به‌صورت سرویس ملی احراز هویت مبتنی بر OCR قابل توسعه است.
مقیاس اقتصادی: کاهش هزینه‌های عملیاتی احراز هویت تا ۷۰٪، تسریع ثبت‌نام کاربران و افزایش نرخ تبدیل در خدمات آنلاین از نتایج مستقیم این پروژه خواهد بود.

کاربران نهایی:

  • بانک‌ها، PSPها و شرکت‌های فین‌تک برای KYC دیجیتال
  • سامانه‌های بیمه، بورس و خدمات آنلاین دولت الکترونیک
  • پلتفرم‌های اعطای وام و اعتبارسنجی دیجیتال
  • کاربران حقیقی برای ثبت‌نام و احراز هویت سریع در اپلیکیشن‌ها

تأثیر کلان:

  • تسهیل دسترسی مردم به خدمات مالی و دولتی غیرحضوری
  • افزایش شفافیت و کاهش جعل هویت در تراکنش‌های دیجیتال
  • توسعه زیرساخت احراز هویت ملی و هم‌راستایی با اهداف دولت هوشمند
  • کاهش ریسک‌های امنیتی و بهبود تجربه کاربری در تعاملات دیجیتال

جمع‌بندی فازبندی پیشنهادی پروژه

فاز

عنوان فاز

خروجی کلیدی

نوع فعالیت

۱

مطالعه تطبیقی فناوری OCR و تحلیل نیاز بومی

گزارش تحقیق و مستند الزامات

Research

۲

طراحی معماری نرم‌افزار و ماژول‌های OCR و تطبیق

مستند فنی و مدل داده

Design

۳

توسعه موتور OCR فارسی و الگوریتم تطبیق داده

هسته نرم‌افزاری OCR و ماژول Match Engine

R&D

۴

طراحی API و SDK فین‌تک‌ها و بانک‌ها

ابزار توسعه‌دهنده و مستند فنی

Development

۵

تست دقت، امنیت و پایلوت در محیط واقعی

گزارش ارزیابی عملکرد و امنیت

Validation



ملاحظات چارچوب پروپوزال ارسالی:

نگاه ماژولار و فازبندی:

به توجه به نوع تامین مالی پروژه که مبتنی بر اعتبار مالیاتی بانک مرکزی که عطف به تفاهم نامه بانک مرکزی و معاونت علمی ریاست جمهوری است، پروپوزال تهیه شده باید ساختار فازبندی شده و ماژولار داشته باشد و برای بازه زمانی یک ساله طراحی شده باشد و از سوی دیگر خروجی های هر فاز یا ماژول قابل اندازه گیری و بررسی باشد. از این رو ساختار فازبندی پیشنهادی در RFP موجود ارائه شده است با توجه به دانش و تجربه شرکت ارسال کننده پروپوزال، قابلیت بهبود و اصلاح دارد.

نگاه مالی مبتنی بر تحقیق و توسعه:

باتوجه به ماهیت R&D این پروژه و اهمیت سهم تحقیق برای نوآوری نسبت به راهکارهای موجود در بازار یا نمونه های بین المللی، باید بیش از 40 درصد ارزش پروژه باید برای مصارف مربوط به تحقیقات مورد نیاز برای توسعه محصول باشد. میزان سطح نوآوری و بخشی از محصول / پروژه که نسبت به راهکارهای حال حاضر نوآورانه است، تصریح و شفاف شود.

سرفصل هزینه کرد موردپذیرش:

باتوجه به نوع تامین مالی پروژه، باید محل مصرف منابع تامین شده عطف به آیین نامه های معاونت علمی و فناوری ریاست جمهوری برای پروژه های R&D در موضوعات ذیل باشد:

  • تهیه و اجاره فضای کار اختصاصی تحقیق و توسعه: هزینه اجاره فضای تحقیق و توسعه با اولویت استقرار در زیست بوم نوآوری متناسب با پروژه تحقیق و توسعه
  • ماشین آلات و تجهیزات: معادل استهلاک سالیانه ماشین آلات و تجهیزات در صورتی که نصب و راه اندازی شده باشد.
  • نیروی انسانی : معادل حقوق و مزایای مندرج در لیست بیمه تامین اجتماعی برای نیروی انسانی مستقیم در پروژه های تحقیق و توسعه تا سقف حداکثر دستمزد مشمول کسر حق بیمه 
  • مواد اولیه و قطعات مصرفی : مواد اجزاء و قطعات به میزان متناسب برای تولید آزمایشی به تعداد محدود برای ساخت نمونه اولیه و به میزان به کار رفته برای ساخت واحد آزمایشی
  • تاییدیه ها و استانداردها: 
  • هزینه آزمون ها و تست ها برای تحقیق و توسعه 
  • استانداردهای ویژه و اختصاصی بر روی محصولات و خدمات مرتبط با پروژه مورد نظر 
  • هزینه ثبت پتنت بین المللی  
  • همکاری فناورانه: هزینه کرد قرارداد با شرکت های دانش بنیان و فناور دانشگاه ها و مراکز پژوهشی با تایید دبیرخانه و در چارچوب سرفصل های مورد تایید هزینه کرد در پروژه های تحقیق و توسعه

در پروپوزال ارسالی، پیشنهاد کلی نسبت به ساختار هزینه اعلام گردد.

 

تدقیق فازهای عملیاتی و ساختار هزینه کرد پس از ارزیابی شرکت های درخواست دهنده، با مشارکت ذینفعان بانک مرکزی و ناظران پروژه در همکاری با شرکت انجام خواهد شد.

Comments are disabled.