طراحی و راه‏اندازی سندباکس داده با هدف پشتیبانی از نوآوری‏های مبتنی بر تحلیل داده در صنعت پرداخت

شرح مسئله و اهداف شرکت برای تعریف پروژه

در اکوسیستم پرداخت کشور، یکی از موانع اساسی در مسیر توسعه خدمات نوآورانه، عدم دسترسی ایمن و کنترل‌شده به داده‌های واقعی تراکنش‌ها و کاربران است. شرکت‌های نوآور، فین‌تک‌ها و مراکز تحقیق و توسعه برای طراحی الگوریتم‌های تحلیلی، اعتبارسنجی، ضدتقلب، یا بهینه‌سازی تجربه کاربری، نیازمند محیطی هستند که بتوانند با داده‌های واقعی اما ناشناس‌سازی‌شده (Masked Data) کار کنند.

در حال حاضر، دسترسی مستقیم به داده‌های عملیاتی بانک‌ها یا شرکت‌های پرداخت به دلیل الزامات امنیتی و حریم خصوصی ممنوع است. ازاین‌رو ایجاد یک سندباکس داده (Data Sandbox) با معماری امن و قابل‌کنترل، می‌تواند بستر تحقیق، آزمایش و توسعه محصولات داده‌محور را فراهم آورد.

هدف از اجرای این پروژه، طراحی و راه‌اندازی سکوی ملی یا سازمانی سندباکس داده است که به محققان، شرکت‌های دانش‌بنیان و فین‌تک‌ها اجازه دهد در محیطی ایزوله، به داده‌های تراکنش و کاربران (به‌صورت غیرمستقیم و ناشناس) دسترسی پیدا کنند و الگوریتم‌ها و مدل‌های نوآورانه خود را توسعه دهند.

اهداف کلان پروژه عبارت‌اند از:

  • طراحی معماری فنی سندباکس داده با تمرکز بر امنیت، کنترل دسترسی و حفظ حریم خصوصی.
  • توسعه ابزارهای ناشناس‌سازی (Data Masking) و تصادفی‌سازی داده (Data Synthesis).
  • فراهم‌سازی داده‌های آزمایشی واقعی و شبه‌واقعی برای تحلیل، یادگیری ماشین و آزمون الگوریتم‌ها.
  • ایجاد داشبورد مدیریتی برای کنترل دسترسی، سطح داده و نظارت بر فعالیت کاربران.
  • پشتیبانی از نوآوری‌های داده‌محور در حوزه‌های پرداخت، اعتبارسنجی، ضدتقلب و هوش تجاری.

چالش‌های فنی و تخصصی پروژه

  1. طراحی معماری امن و ایزوله: ایجاد محیطی که داده‌ها از سیستم‌های عملیاتی جدا بوده و هیچ مسیر نشت اطلاعاتی وجود نداشته باشد.
  2. ناشناس‌سازی داده‌ها (Data Masking & Tokenization): توسعه الگوریتم‌هایی برای حذف یا رمزنگاری اطلاعات حساس مانند شماره کارت، شماره ملی یا IP کاربر بدون از بین‌رفتن ماهیت تحلیلی داده.
  3. تولید داده‌های شبه‌واقعی (Synthetic Data Generation): ساخت داده‌های مصنوعی مبتنی بر الگوهای واقعی تراکنش‌ها برای تست و آموزش مدل‌های هوش مصنوعی.
  4. کنترل سطح دسترسی کاربران: طراحی سیستم دسترسی چندسطحی (Role-Based Access) برای محققان، تیم‌های داخلی و شرکت‌های ثالث.

  5. پایش و ثبت فعالیت‌ها (Audit & Logging): رصد کامل فعالیت کاربران برای جلوگیری از سوءاستفاده یا استخراج غیرمجاز داده‌ها.
  6. مدیریت حجم داده و کارایی تحلیل: طراحی زیرساخت داده توزیع‌شده (Data Lake + Compute Cluster) برای پردازش حجم زیاد داده‌ها با زمان پاسخ مناسب.
  7. انطباق با الزامات امنیت و حریم خصوصی: رعایت چارچوب‌های قانونی مرکز ماهر، بانک مرکزی و قوانین حفاظت از داده‌های شخصی (Data Privacy Regulation).
  8. تعامل با اکوسیستم نوآوری: تعریف فرآیندهای شفاف برای مشارکت شرکت‌های دانش‌بنیان، فین‌تک‌ها و مراکز تحقیقاتی در استفاده از داده‌ها.

فازهای عملیاتی پیشنهادی:

  • فاز ۱: تحلیل نیازها و طراحی مفهومی سندباکس داده.
  • فاز ۲: طراحی معماری فنی، مدل داده و سیاست‌های امنیتی.
  • فاز ۳: توسعه ابزارهای Masking، Tokenization و تولید داده مصنوعی.
  • فاز ۴: پیاده‌سازی محیط ایزوله و اتصال به مخزن داده‌های واقعی.
  • فاز ۵: تست امنیت، اجرای پایلوت و آماده‌سازی برای بهره‌برداری عمومی.

نوآوری محصول نسبت به محصولات مشابه در کشور/شرکت

  1. اولین سندباکس داده بومی در صنعت پرداخت کشور: طراحی‌شده برای پشتیبانی از پروژه‌های تحقیقاتی، هوش مصنوعی و اعتبارسنجی مالی.
  2. استفاده از ترکیب داده واقعی و مصنوعی: برای حفظ حریم خصوصی در کنار دقت تحلیلی بالا.
  3. زیرساخت قابل توسعه و ماژولار: قابلیت اتصال به منابع داده مختلف (PSPها، بانک‌ها، اپراتورها).
  4. پشتیبانی از نوآوری باز (Open Innovation): امکان مشارکت فین‌تک‌ها، استارتاپ‌ها و دانشگاه‌ها در محیط ایمن.
  5. استفاده از فناوری‌های نوین امنیتی: مانند Differential Privacy، Homomorphic Encryption و Zero Trust Architecture.
  6. پشتیبانی از یادگیری ماشین و تحلیل داده درون‌محیطی (In-Sandbox ML): اجرای مدل‌های تحلیلی بدون خروج داده از محیط امن.

مقیاس پروژه

مقیاس فنی: در فاز نخست در سطح یک شرکت پرداخت یا مرکز داده بانکی اجرا می‌شود و در مراحل بعدی به‌صورت ملی قابل توسعه است.
مقیاس اقتصادی: ایجاد چنین سندباکسی منجر به کاهش هزینه‌های تحقیق و توسعه، افزایش سرعت تست محصولات جدید، و ایجاد فرصت برای کسب‌وکارهای داده‌محور خواهد شد.

کاربران نهایی:

  • بانک‌ها، PSPها و فین‌تک‌ها
  • مراکز تحقیق و توسعه و شرکت‌های دانش‌بنیان
  • دانشگاه‌ها و مؤسسات تحلیل داده
  • نهادهای نظارتی برای پایش مدل‌های هوش مصنوعی

تأثیر کلان:

  • تقویت اکوسیستم داده‌محور کشور و تسهیل نوآوری در خدمات مالی
  • افزایش امنیت و اعتماد در اشتراک‌گذاری داده‌های حساس
  • توسعه زیرساخت ملی برای آزمون و تحلیل مدل‌های هوش مصنوعی در صنعت پرداخت
  • کاهش وابستگی به داده‌های خارجی برای آموزش مدل‌های بومی

جمع‌بندی فازبندی پیشنهادی پروژه

فاز

عنوان فاز

خروجی کلیدی

نوع فعالیت

۱

تحلیل نیازها و طراحی مفهومی سندباکس داده

مدل مفهومی و اهداف فنی پروژه

Research

۲

طراحی معماری فنی و سیاست‌های امنیتی

مستند معماری داده و مدل امنیتی

Design

۳

توسعه ابزارهای Masking و داده مصنوعی

موتور ناشناس‌سازی و تولید داده

R&D

۴

پیاده‌سازی محیط ایزوله و اتصال به داده واقعی

محیط سندباکس عملیاتی

Implementation

۵

تست امنیت، پایلوت و بهره‌برداری

گزارش تست، مستند بهره‌برداری و آموزش کاربران

Validation



ملاحظات چارچوب پروپوزال ارسالی:

نگاه ماژولار و فازبندی:

به توجه به نوع تامین مالی پروژه که مبتنی بر اعتبار مالیاتی بانک مرکزی که عطف به تفاهم نامه بانک مرکزی و معاونت علمی ریاست جمهوری است، پروپوزال تهیه شده باید ساختار فازبندی شده و ماژولار داشته باشد و برای بازه زمانی یک ساله طراحی شده باشد و از سوی دیگر خروجی های هر فاز یا ماژول قابل اندازه گیری و بررسی باشد. از این رو ساختار فازبندی پیشنهادی در RFP موجود ارائه شده است با توجه به دانش و تجربه شرکت ارسال کننده پروپوزال، قابلیت بهبود و اصلاح دارد.

نگاه مالی مبتنی بر تحقیق و توسعه:

باتوجه به ماهیت R&D این پروژه و اهمیت سهم تحقیق برای نوآوری نسبت به راهکارهای موجود در بازار یا نمونه های بین المللی، باید بیش از 40 درصد ارزش پروژه باید برای مصارف مربوط به تحقیقات مورد نیاز برای توسعه محصول باشد. میزان سطح نوآوری و بخشی از محصول / پروژه که نسبت به راهکارهای حال حاضر نوآورانه است، تصریح و شفاف شود.

سرفصل هزینه کرد موردپذیرش:

باتوجه به نوع تامین مالی پروژه، باید محل مصرف منابع تامین شده عطف به آیین نامه های معاونت علمی و فناوری ریاست جمهوری برای پروژه های R&D در موضوعات ذیل باشد:

  • تهیه و اجاره فضای کار اختصاصی تحقیق و توسعه: هزینه اجاره فضای تحقیق و توسعه با اولویت استقرار در زیست بوم نوآوری متناسب با پروژه تحقیق و توسعه
  • ماشین آلات و تجهیزات: معادل استهلاک سالیانه ماشین آلات و تجهیزات در صورتی که نصب و راه اندازی شده باشد.
  • نیروی انسانی : معادل حقوق و مزایای مندرج در لیست بیمه تامین اجتماعی برای نیروی انسانی مستقیم در پروژه های تحقیق و توسعه تا سقف حداکثر دستمزد مشمول کسر حق بیمه 
  • مواد اولیه و قطعات مصرفی : مواد اجزاء و قطعات به میزان متناسب برای تولید آزمایشی به تعداد محدود برای ساخت نمونه اولیه و به میزان به کار رفته برای ساخت واحد آزمایشی
  • تاییدیه ها و استانداردها: 
  • هزینه آزمون ها و تست ها برای تحقیق و توسعه 
  • استانداردهای ویژه و اختصاصی بر روی محصولات و خدمات مرتبط با پروژه مورد نظر 
  • هزینه ثبت پتنت بین المللی  
  • همکاری فناورانه: هزینه کرد قرارداد با شرکت های دانش بنیان و فناور دانشگاه ها و مراکز پژوهشی با تایید دبیرخانه و در چارچوب سرفصل های مورد تایید هزینه کرد در پروژه های تحقیق و توسعه

در پروپوزال ارسالی، پیشنهاد کلی نسبت به ساختار هزینه اعلام گردد.

 

تدقیق فازهای عملیاتی و ساختار هزینه کرد پس از ارزیابی شرکت های درخواست دهنده، با مشارکت ذینفعان بانک مرکزی و ناظران پروژه در همکاری با شرکت انجام خواهد شد.

Comments are disabled.