پایان نامه دکتری

عنوان: ارائه رویکردی مبتنی بر سنجه برای ارزیابی کیفیت مجموعه داده های پیوندی پیش از انتشار

استاد راهنما: دکتر محسن کاهانی

چکیده پایان نامه خانم دکتر بهکمال:

هدف اصلي دادههاي پيوندي، تحقق وب معنايي و استخراج دانش از طريق پيوند دادن دادههاي موجود روي وب ميباشد. يكي از موانع دستيابي به اين هدف، وجود مشكلات و خطاها در دادههاي منتشر شده است كه باعث ايجاد پيوندهاي نادرست و درنتيجه استنتاجهاي نامعتبر ميگردد. مطالعه كارهاي انجام شده در اين حوزه نشان ميدهد كه بيشتر محققان بر ارزيابي كيفيت داده پس از انتشار تمركز داشته و
ارزيابي دادهها پيش از انتشار را برعهده مالك يا منتشركننده داده گذاشتهاند. با توجه به اينكه كيفيت دادهها تأثير مستقيم بر موفقيت پروژه دادههاي پيوندي و تحقق وب معنايي دارد، بهتر است تا كيفيت هريك از مجموعههاي داده در مراحل اوليه انتشار و قبل از اضافه شدن به ابر دادههاي پيوندي ارزيابي شود.
در اين رساله، يك رويكرد مبتني بر سنجه براي ارزيابي پيش از انتشار مجموعه دادههاي پيوندي بهعنوان ISO- ارائه ميشود. براي اين منظور، با مطالعه مدلها و چارچوبهاي كيفيت داده، مدل 25012 مدل مبنا انتخاب و با نگاشت ابعاد كيفيت مدل مبنا به ابعاد كيفيت دادههاي پيوندي، شش بعد كيفي كاملبودن، دقت معنايي، دقت نحوي، سازگاري، يكتايي و پيوندپذيري بهعنوان ابعاد كيفيت ذاتي دادههاي پيوندي شناسايي شدهاند. سپس، با استفاده از رويكرد هدف، پرسش، سنجه براي هريك از ابعاد كيفي شش- گانه، سنجههاي مناسب تعريف و بهصورت رسمي بيان شده است. استراتژي ارزيابي مدل پيشنهادي، شامل سه مرحله اعتبارسنجي تئوري، ارزيابي تجربي به روش آزمايشات و نظرسنجي از خبرگان بوده كه فرايند اجراي هريك، به تفصيل در رساله مورد بررسي قرار گرفته است. در پايان، با بهرهگيري از روشهاي
يادگيري، يك مدل پيشبيني كيفيت برمبناي سنجههاي پيشنهادي ارائه شده است. نتايج ارزيابيها نشان داد كه سنجههاي پيشنهادي معتبر، كاربردي و مقياسپذير هستند و همچنين قابليت ارزيابي كيفيت ذاتي هر مجموعه داده را بهصورت كاملاً خودكار دارند. بنابراين، منتشركنندگان دادهها قادرند تا با استفاده از مدل پيشنهادي، كيفيت ذاتي مجموعه داده خود را قبل از انتشار ارزيابي كنند.