ارائه رهيافتي جديد براي توليد پيكره موازي انگليسي-فارسي

چكيده:
در اين پژوهش، براي اولين بار مدلي تركيبي براي تراز بندی جملات، جهت ساخت پيکره‌هاي موازي انگليسي-فارسي ارائه شده است. در حالت کلي چارچوب روش پيشنهادي، غير وابسته به زبان‌های مبدأ و مقصد بوده و از آن می‌توان براي توليد پيکره‌هاي موازي، براي هر جفت زبان ديگر، نيز استفاده کرد. نتايج بدست آمده از پياده‌سازي‌ها نشان مي‌دهد که بکار بردن ویژگی‌های زباني و غير زباني ، عملکرد سيستم را تا حد قابل قبولي بهبود خواهد بخشيد. همچنين در اين تحقيق ميزان تأثير استفاده از شباهت‌هاي طولي، ترجمه تحت‌اللفظی و نقش دستوري كلمات، به صورت مستقل يا تركيبي، براي عمليات ترازبندي مورد بررسي قرار گرفته است. بکارگیری طبقه بندهای سلسله‌مراتبي در تشخيص نوع تراز بندی به عنوان يكي از شاخص‌هاي اصلي سيستم پيشنهادي محسوب مي‌شود كه موجب بالا رفتن دقت وسرعت عمليات توليد پيكره نسبت به ساير مدل‌ها مي‌شود. از ویژگی‌های ديگر اين روش، قابليت توسعه‌پذيري آن است. به اين ترتيب كه مي‌توان با گنجاندن خصوصياتي (در بدنه بردارهاي ورودي) كه ممكن است در آينده براي تشخيص بهتر نوع تراز بندی مورد توجه قرار گيرند كيفيت سيستم ترازبندي را ارتقاء بخشيد. با اين حال، چالش اساسي اين رهيافت و بسياري از روش‌های پيشين، وجود سلايق متنوع در ترجمه متون است. اين مسئله در برخي موارد موجب توليد جملاتي مي‌گردد كه مشابهت آن‌ها با متن اصلي در حد معنا بوده و تنها قابل درك و تشخيص براي انسان مي‌باشد. در چنين وضعيتي كار استخراج جفت عبارات معادل، بسيار دشوار است. علاوه براين در مورد متونی که مقید به رعایت ساختار دستوری زبان فارسی و انگلیسی نمی‌باشند عملیات تشخیص جملات هم تراز ممکن است به خوبی انجام نپذیرد.
كلمات كليدي:
تراز بندی جملات، پيكره موازي، ترجمه آماري

لینک دریافت مقاله