پروژه ساخت پیکره قرآنی فرقان

آنتولوژی قرآن کریم

معرفی پروژه

امام علی (ع) می­فرماید: “قرآن را زمانه تفسیر می‌کند.”
در برداشت از چنین روایاتی است که علامه طباطبایی هر دهه را نیازمند تفسیری جدید از قرآن دانسته­اند و بدیهی است این مهم مستلزم بهره مندی از فناوری‌های معاصر است. با این نگرش و در پیروی از امر امام راحل (ره) به تلاش در تنقیب قرآن، “شبکه پژوهشی قرآن­ کاوی” (Quran Mining Research Network) در دهه اخیر شکل یافته است تا با بهره گیری از فناوری‌های متن کاوی (Text Mining) ابزار پیشرفته هوش مصنوعی رایانه را در خدمت اکتشاف اطلاعات پنهان متن قرآن قرار ­دهد. محققین این شبکه تلاش دارند نه تنها بحث‌های حل نشده و شبهه‌های ایجاد شده برای قرآن را مرتفع سازند، بلکه جنبه‌هایی ناشناخته از این اصلی ترین منبع هدایت را به بشریت عرضه کنند. در همین راستا طراحي و پياده‌سازي پيكره متني قرآن كريم در قالب RDF و به شكل محتواي الكترونيكي، حاوي اطلاعات صرفي و نحوي، امكان استفاده و كاوش را براي هر گونه پژوهش و پردازش هوشمند ايجاد خواهد کرد.
تبيين اعجاز زباني قرآن كريم، در دستيابي به لايه‌هاي نامشهود زباني اين متن الهي می‌باشد. بدین ترتیب پس از فراهم شدن بستر مناسب جهت متن کاوی روی قرآن کریم می‌توان با طراحی و بهره گیری از ابزارهای متن کاوی به اکتشاف کلامی و معنایی متن قرآن کریم پرداخت. دانش هوشمند متن كاوي (text mining) به عنوان جديد ترين وجه همكاري بين دانش‌هاي فناوري اطلاعات، زبان‌شناسي و ادبيات در كاوش رايانه اي متون بشري قصد حصول اين امر را دارد و چنين كاوشي مستلزم ايجاد پيكره‌هاي متني برچسب گذاري شده از آن متون است كه به شكل محتوايي الكترونيكي حاوي اطلاعات صرفي و نحوي متون مورد نظرند.
پیکره متنی و زیرساختی که تحت عنوان “پیکره فرقان” برای قرآن کریم تولید گردیده است، حاصل بهره‌گیری از سامانه ای هوشمند است که در آزمایشگاه فناوری وب دانشگاه فردوسی مشهد، طراحی و پیاده سازی شده است. این پیکره با بیش از 587 مگابایت داده، حاوی کلیه ی اطلاعات قرآنی، آماری، متن و ترجمه فارسی و انگلیسی آیات و برچسب گذاری صرفی و نحوی متن عربی، فارسی و انگلیسی آیات، ریشه یابی کلمات آنها و بسیاری موارد دیگر در قالب RDF است و امکان استفاده و کاوش را برای هرگونه پژوهش و پردازش هوشمند ایجاد کرده است.
با اطلاعات تولید شده در قالب RDF برای سوره، آیه، صفحه، صرف و نحو آیات و حروف الفبایی، دامنه‌ی وسیعی از اطلاعات مفید و سودمند برای انجام عملیات متن کاوی برای پژوهشگران و محققان قرآنی فراهم گردیده است. با بهره گیری از دانش هوشمند متن كاوی بر روی پیكره های متنی برچسب گذاری شده قرآن کریم و تهیه آنتولوژی یا هستان شناسی جامعی از مفاهیم موجود در قرآن کریم، در گام های آتی می توان در تبیین اعجاز زبانی قرآن كریم با دستیابی به لایه های نامشهود زبانی این متن الهی گام برداشت.
لازم به ذکر است که کلیه مفاهیم و موجودیت های موجود در پیکره ی جمع آوری شده، به آنتولوژی ها و مفاهیم مشابه با آنها در وب، لینک داده شده اند. به طوری که پیکره ی موجود در حال حاضر شامل بیش از 332.589 پیوند می باشد که تعداد 33.854 مورد از آنها منحصر بفرد می باشد. در کل پیکره ی تهیه شده با حجم داده ای نزدیک به 587 مگابایت، بیش از 13.298 RDF وجود دارد. همچنین 13.299 فایل HTML (صفحه وب) برای بازنمایی اطلاعات RDFها وجود دارد.
در حال حاضر ابزار پارس کردن اطلاعات صرف و نحوی آیات، طراحی گردیده است و کار برای طراحی ابزاری جهت SPARQL زدن بر روی داده های RDF قرآنی ادامه دارد. از جمله اقداماتی که می توان در گام های آتی جهت غنی تر شدن خروجی کار و همچنین تولید دانش از پیکره ی موجود به آنها پرداخت، می توان به موارد ذیل اشاره نمود:
– مشخص کردن موضوع و مفهوم غالب در هر سوره با بررسی و پردازش مفاهیم مندرج در آیات سوره. – پردازش متن و دسته بندی موضوعات سوره ها و آیات و مشخص کردن رابطه بین آنها.
– ساخت آنتولوژی موضوعات و مفاهیم قرآن.
– منتسب کردن آیات به مفاهیم. – به دنبال آن، تعیین ارتباط بین لغات، آیه ها، سوره ها، جزء ها و غیره با پیوند دادن آنها با اطلاعات موجود در وب. – تکمیل و گسترش آنتولوژی مفاهیم قرآنی با روند یادگیری ماشینی و …
-پرسش و استنتاج بر روی پیکره ی تولید شده با SPARQL زدن بر روی داده های RDF و پارس کردن فایل XML حاوی اطلاعات صرف و نحو متن عربی آیات و تجزیه – تحلیل انسانی و یا هوشمند نتایج جهت کشف روابط کلامی و معنایی پنهان در متن قرآن کریم.


اعضای پروژه

 


تاریخ اجرا

1391