TY - JOUR ID - 3127 TI - بهینه‌سازی آشفتگی اسامی نویسندگان مقالات فارسی با استفاده از روش جنگل تصادفی JO - پژوهش نامه علم سنجی JA - RSCI LA - fa SN - 2423-3773 AU - مظفری, نیلوفر AU - ورع, نرجس AD - استادیار، گروه پژوهشی طراحی و عملیات سیستم‌ها، مرکز منطقه‌ای اطلاع‌رسانی علوم و فناوری، شیراز، ایران . AD - عضو هیئت علمی گروه پژوهشی ارزیابی و توسعه منابع، مرکز منطقه‌ای اطلاع‌رسانی علوم و فناوری و دانشجوی دکتری علم اطلاعات و دانش شناسی. شیراز، ایران Y1 - 2022 PY - 2022 VL - 8 IS - (شماره 2، پاییز وزمستان) SP - 203 EP - 220 KW - آشفتگی نگارش KW - جنگل تصادفی KW - نویسندگان مقالات فارسی KW - مستندسازی نام‌ها KW - الگوریتم ساندکس DO - 10.22070/rsci.2021.13393.1449 N2 - هدف: ارائه چارچوبی جهت حل مشکل آشفتگی و پراکندگی اسامی نویسندگان در مقالات فارسی که منجر به گسیختگی و فقدان جامعیت در بازیابی اطلاعات شده است.روش‌شناسی: پژوهش حاضر از نوع کاربردی علم‌سنجی است که به روش اسنادی انجام شده است. جامعه آماری را از 913 رکورد از نام نویسندگان مقالات فارسی برگرفته از پایگاه استنادی علوم جهان اسلام، طی بازه زمانی 1395 تا 1397 تشکیل می‌دهد. چارچوب پیشنهادی از سه مرحله جستجو، تطابق و گروه‌بندی تشکیل شده است. در این راستا، بعد از پیش‌پردازش اولیه و استخراج ویژگی، عملیات جستجو با هدف یافتن رکوردهایی که بالقوه احتمال یکسان‌بودن آنها وجود دارد انجام شده و سپس رکوردهای یکسان از طریق بررسی‌های بیشتر در مرحله تطابق که مبتنی بر جنگل تصادفی است یافت می‌شود.یافته‌ها: ویژگی‌های پست الکترونیک، نام خانوادگی و نام از مهم‌ترین ویژگی‌ها برای بهینه‌سازی آشفتگی نگارش اسامی هستند. استفاده از جنگل تصادفی به‌عنوان طبقه‌بند در مرحله تطابق، با دقت بالای 99 درصد می‌تواند مشکل آشفتگی نگارش اسامی نویسندگان را برطرف نماید.نتیجه‌گیری: نتایج نشان از کارایی بالای این روش در یکدست‌سازی اسامی با توجه به معیارهای دقت، بازیافت و مقدار اف نسبت به طبقه‌بندهای بردار پشتیبان، نزدیک‌ترین همسایه و ژنتیک دارد. UR - https://rsci.shahed.ac.ir/article_3127.html L1 - https://rsci.shahed.ac.ir/article_3127_be97cc00d7cc3fb936196002dd18c62e.pdf ER -