چكيده:
در اين پژوهش، براي اولين بار مدلي تركيبي براي تراز بندی جملات، جهت ساخت پيکرههاي موازي انگليسي-فارسي ارائه شده است. در حالت کلي چارچوب روش پيشنهادي، غير وابسته به زبانهای مبدأ و مقصد بوده و از آن میتوان براي توليد پيکرههاي موازي، براي هر جفت زبان ديگر، نيز استفاده کرد. نتايج بدست آمده از پيادهسازيها نشان ميدهد که بکار بردن ویژگیهای زباني و غير زباني ، عملکرد سيستم را تا حد قابل قبولي بهبود خواهد بخشيد. همچنين در اين تحقيق ميزان تأثير استفاده از شباهتهاي طولي، ترجمه تحتاللفظی و نقش دستوري كلمات، به صورت مستقل يا تركيبي، براي عمليات ترازبندي مورد بررسي قرار گرفته است. بکارگیری طبقه بندهای سلسلهمراتبي در تشخيص نوع تراز بندی به عنوان يكي از شاخصهاي اصلي سيستم پيشنهادي محسوب ميشود كه موجب بالا رفتن دقت وسرعت عمليات توليد پيكره نسبت به ساير مدلها ميشود. از ویژگیهای ديگر اين روش، قابليت توسعهپذيري آن است. به اين ترتيب كه ميتوان با گنجاندن خصوصياتي (در بدنه بردارهاي ورودي) كه ممكن است در آينده براي تشخيص بهتر نوع تراز بندی مورد توجه قرار گيرند كيفيت سيستم ترازبندي را ارتقاء بخشيد. با اين حال، چالش اساسي اين رهيافت و بسياري از روشهای پيشين، وجود سلايق متنوع در ترجمه متون است. اين مسئله در برخي موارد موجب توليد جملاتي ميگردد كه مشابهت آنها با متن اصلي در حد معنا بوده و تنها قابل درك و تشخيص براي انسان ميباشد. در چنين وضعيتي كار استخراج جفت عبارات معادل، بسيار دشوار است. علاوه براين در مورد متونی که مقید به رعایت ساختار دستوری زبان فارسی و انگلیسی نمیباشند عملیات تشخیص جملات هم تراز ممکن است به خوبی انجام نپذیرد.
كلمات كليدي:
تراز بندی جملات، پيكره موازي، ترجمه آماري