نوع مقاله : مقاله پژوهشی
نویسندگان
1 گروه مهندسی کامپیوتر، واحد آبادان، دانشگاه آزاد اسلامی، آبادان، ایران
2 دانشکده موضوعی هوشمصنوعی و فناوریهای اجتماعی و پیشرفته، واحد نجفآباد، دانشگاه آزاد اسلامی، نجفآباد، ایران،
3 گروه مهندسی کامپیوتر، واحد ایلام، دانشگاه آزاد اسلامی، ایلام، ایران،
چکیده
کسبوکارهای نوظهور در مراحل آغازین هوشمندسازی دادهمحور با چالش شروع سرد مواجهاند، زیرا تنها به حجم محدودی از دادههای واقعی دامنهای برای آموزش و اعتبارسنجی مدلهای هوش مصنوعی دسترسی دارند. این محدودیت داده، همراه با ناسازگاری دادههای عمومی با نیازهای خاص هر کسبوکار، منجر به کاهش دقت پیشبینیها و کیفیت توصیهها میشود. علاوه بر این، پویایی محیطهای تجاری و تغییرات سریع در توزیع داده و مفاهیم (نظیر انحراف داده و تغییر مفهوم)، خطر فراموشی دانش پیشین در یادگیری را تشدید میکند. چارچوب پیشنهادی این پژوهش، یک معماری یکپارچه و مقیاسپذیر برای ادغام یادگیری انتقالی و هوش جمعی ارائه میدهد. چارچوب پیشنهادی چهار لایه دارد: پیشپردازش دادهها، یادگیری انتقالی، تقویت با بازخورد کاربران، و پیشبینی پیوسته با پایش انحراف. در این چارچوب، دادههای آموزشی ترکیبی از دادههای واقعی، عمومی و بازخورد کاربران هستند و بهینهسازی مدل با هدف کمینهسازی خطا و کنترل پیچیدگی انجام میگیرد. ارزیابی تجربی بر روی سه مجموعهداده واقعی نشان داد که این رویکرد بهبود مطلوبی در عملکرد ایجاد میکند. علاوه بر معیار دقت، سایر شاخصها همچون توانایی شناسایی نمونههای مثبت، تعادل میان دقت و بازخوانی، کاهش خطا و ثبات در برابر تغییرات داده نیز بهبود داشتند.
کلیدواژهها
موضوعات
عنوان مقاله [English]
A framework for integrating transfer learning and crowd intelligence to overcome the data-poor regime in emerging businesses
نویسندگان [English]
- maryam nooraei abadeh 1
- shohreh Ajoudanian 2
- sondos bahadori 3
1 Department of Computer Engineering, Abadan Branch, Islamic Azad University, Abadan, Iran
2 Department of Computer Engineering, Na.C., Islamic Azad University, Najafabad, Iran,
3 Department of Computer Engineering, Arv. C., Islamic Azad University, Abadan, Iran
چکیده [English]
Early-stage startups face the problem of cold start, as they have limited real-world data to train AI models. This lack of data, combined with the incompatibility of generic data with specific business needs, reduces the accuracy of predictions and recommendations. Rapid changes in data and concepts (such as data and concept drift), the risk of forgetting prior knowledge in transfer learning, and the heterogeneous quality of user feedback are the main challenges in this area. The proposed framework is an integrated and scalable architecture that combines transfer learning and crowd intelligence. The framework consists of four parts: collection and preprocessing of (limited), generic, and user feedback real-world data; transfer learning with a pretrained model and efficient optimization to prevent forgetting prior knowledge; model enhancement with filtered and weighted user feedback; and continuous prediction by monitoring data and concept changes with mathematical criteria. The training data is composed of a combination of real, generic, and user feedback data, and optimization is performed by minimizing error and controlling complexity. Evaluation on three real datasets. Other metrics such as prediction accuracy, positive sample detection, balance between the two, error reduction, and data stability were also improved in all three datasets, especially in investment data that is more scattered. This framework increases the efficiency of limited data and ensures the stability of the model.
کلیدواژهها [English]
- Transfer Learning
- Collective Intelligence
- Data Drift
- Low-Data Regime
- Emerging Businesses