مدلسازی موضوعی مقالات پژوهشگران ایرانی در حوزه غدد درونریز و متابولیسم در پایگاه استنادی وب علوم

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری علم اطلاعات و دانش‌شناسی، گروه علوم ارتباطات و دانش‌شناسی، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران

2 استاد گروه علم اطلاعات و دانش شناسی، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات، تهران، ایران.

3 دانشیار گروه ریاضی کاربردی، دانشگاه آزاد اسلامی واحد تهران جنوب، تهران، ایران

4 دانشیار گروه علوم ارتباطات ودانش شناسی، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران.

چکیده

هدف: روشهای مدلسازی موضوعات احتمالاتی متشکل از مجموعهای از الگوریتمهایی است که هدف اصلی آنها کشف ساختار پنهان موضوعی در حجم وسیعی از اسناد است. هدف از انجام این پژوهش مدلسازی موضوعی مقالات پژوهشگران ایرانی در حوزه غدد درونریز و متابولیسم در پایگاه استنادی وب علوم است.
روش شناسی: پژوهش حاضر از نوع کاربردی و با روش متن کاوی و تحلیل محتوا به انجام رسیده است. در این پژوهش کلیه دادههای مورد نیاز، از پایگاه استنادی وب علوم با استفاده از کلیدواژههای ثبتشده در سرعنوان موضوعی پزشکی بدون محدودیت زمانی تا 15 آبان 97 بازیابی شدند. سپس با استفاده از الگوریتم تخصیص پنهان دریکله مجموعه اسناد در محیط متلب تجزیه و تحلیل شدند.
یافتهها: دستههای موضوعی به صورت دستههایی از20 واژه و در 10 دسته موضوعی استخراج شدند. سپس توسط فوق تخصص غدد دستههای موضوعی بر اساس ارتباط آنها به موضوعات مختلف حوزه غدد درون‌ریز و متابولیسم نام گذاری شدند و به هر دسته عنوان موضوعی اختصاص یافت.
نتیجهگیری: نتایج بیانگر این است که اجرای مدل تخصیص پنهان دریکله عملکرد قابل قبولی در ارائه دستههای موضوعات حوزه غدد داشته است. دستههای موضوعی استخراج شده دارای تجانس و ارتباط موضوعی خوبی با یکدیگر هستند.

کلیدواژه‌ها


عنوان مقاله [English]

Topic modeling of endocrinology and metabolism articles by Iranian researchers in the web of science

نویسندگان [English]

  • Omolbanin Asadi Qadikolaei 1
  • Nadjla Hariri 2
  • Maryam Khademi 3
  • Fahimeh Babalhavaeji 4
1 PhD student in Information and Knowledge Science, Department of Communication and Knowledge Sciences, Science and Research Branch, Islamic Azad University, Tehran, Iran.
2 Professor, Information and Knowledge Science, Department of Communication and Knowledge Sciences, Science and Research Branch, Islamic Azad University, Tehran, Iran.
3 Assistant Professor of Applied Mathematics, Islamic Azad University, South Tehran Branch.
4 Associate Professor, Islamic Azad University (Science & Research Branch). 0000-0002-5876-1588
چکیده [English]

Purpose: Probabilistic topic modeling methods consist of a set of algorithms whose main purpose is to discover the hidden subject structure in a large volume of documents. The purpose of this study is to topic modeling the articles of Iranian researchers in the field of endocrinology and metabolism in the Web of Science citation database.
Methodology: The present research is applied type and has been done by text mining and content analysis method. In this study, required data were retrieved from the Web of Science citation database using the keywords registered in the medical subject heading without time limit until November 6, 2018.Then, using a hidden allocation algorithm, the whole set of documents in MATLAB environment was analyzed.
Findings: Subject categories were extracted as groups of 20 words in 10 subject categories. Then, by endocrinologist, the subject categories were named based on their relationship to various topics in the field of endocrinology and metabolism, and each category was assigned a subject title.
Conclusion: The results indicate that the implementation of the latent Dirichlet allocation model has an acceptable performance in presenting the categories of endocrinology and metabolism. The extracted subject categories have good homogeneity and thematic relevance with each other.

کلیدواژه‌ها [English]

  • Endocrinology and metabolism
  • Topic modeling
  • LDA
  • Text mining
  • Iran