پیش بینی رواناب حوضه با استفاده از برنامه ریزی بیان ژن (مطالعه موردی: حوضه آبریز کرگانرود گیلان)- مجید عبادی فر؛ مهدی رئوف حق پرور؛ حمید محمدی دهرایی- گروه عطران

0

در این تحقیق، به منظور بررسی کارآیی و توانمندی روش برنامه­ریزی بیان ژن (GEP) در برآورد مقدار رواناب سالانه خروجی از حوضه آبریز کرگانرود در استان گیلان، از دو پارامتر مهم اقلیمی (بارش و دما) و قابلیت­های نرم افزار (GeneXproTools4) استفاده گردید. برای این منظور، داده­ هاي متوسط بارندگی، متوسط حداکثر، حداقل و میانگین دمای سالانة حوضه به عنوان متغیرهای ورودی و همچنین مقادیر رواناب مشاهده­­ای در ایستگاه هیدرومتری ماشین خانه، به عنوان متغیر خروجی مدل در دورة آماري مشترک 30 ساله (از سال­ آبی 66-65 لغایت 95-94) در نظر گرفته شد.

پس از بازسازی و تطویل داده­های بارش و دمای ایستگاههای منتخب، با استفاده از روابط گرادیان بارندگی و گرادیان حرارتی منطقه، مقادیر متوسط بارندگی و سه شاخص درجه حرارت سالانه حوضه برای سالهای آماری مختلف برآورد گردید. جهت دست­یابی به ساختار مناسب بین ورودی­ها و خروجی مدل، ابتدا اطلاعات 21 سال اول آماری (70 درصد) براي آموزش برنامه و 9 سال باقي­مانده (30 درصد) براي صحت­سنجی آن در نظر گرفته شد.

سپس به منظور شناسایی ورودی­های مؤثر، تعداد 8 الگوی مختلف بر اساس تركيب داده­هاي ورودی، طراحی و در نهایت، برای تعیین مناسب­ترین رابطه جهت تخمین رواناب حوضه، از دو شاخص معتبر جذر میانگین مربعات خطا (RMSE) و ضریب همبستگی (2R) استفاده گردید. نتایج تحقیق نشان داد، با ساختار میانگین بارندگی، متوسط حداکثر، حداقل و میانگین دمای سالانه حوضه، ضریب همبستگی (2R) بین داده­های محاسباتی و مشاهد­ه­ای در دوره صحت­سنجی به بیشترین مقدار (0.966) و مقدار شاخص RMSE به کمترین مقدار (0.376) ­می­رسد.

در نتیجه ساختار فوق به عنوان مناسب­ترين الگوي ورودي جهت تخمین رواناب سالانه حوضه پذیرفته شده و بر این اساس، رابطه ریاضی مربوطه با استفاده از زبان برنامه نویسی MATLAB و بکارگیری چهار عملگر اصلي حسابي يعني{/,+, -, ×}، استخراج گردید.

 

کلمات کليدي: برنامه ریزی بیان ژن، رواناب سالانه، GEP، MATLAB،RMSE .

 مقدمه

افزایش جمعیت و به ویژه بالا رفتن سطح زندگی، سبب توسعة صنایع، کشاورزی و فعالیت­های اوقات فراغت گردیده و به تبع آن، حجم آب مصرفی نیز به شدت افزایش یافته است. اگرچه انسان از هزاران سال قبل به اهمیت حیاتی آب پی برده و جهت استفادة صحیح و اصولی از آن قوانینی وضع کرده است، اما هرگز تا این حد نگران نبوده است، به طوری که امروزه مسأله تأمین آب، به عنوان یکی از مهم­ترین مسایل و دغدغه­ها در مدیریت منابع آب به شمار می­رود (محمدی فتیده، 1379).

پیش­بینی دقیق رواناب یکی از مهم­ترین مباحث تحقیقی مهندسان آب در طرحهای منابع آب می­باشد. جديدالتأسيس بودن برخی از ايستگاه‌هاي هيدرومتري، نواقص موجود در آمار ايستگاهها، قرار گرفتن بيشتر رودها در مناطق خشک و لزوم توجه بيشتر به آبهاي سطحي، همه و همه دلايل توجه به مقوله‌ شبيه سازي، پيش‌بيني و توليد آمار مصنوعي در حوضه‌هاي آبريز کشورمان می­باشد (فضل اولي و همکاران، 1385).

اگرچه معادلات و روابط تجربی متعددي براي پيش­بيني رواناب سالانة حوضه­ها مطرح گردیده است، اما به جهت این که این روش­ها مبتنی بر يك­سري عوامل اقليمي و فيزيوگرافي حوضه­ها بوده و اغلب محدود به مناطق خاص می­باشند، در نتیجه ضرايب مربوطه با توجه به شرايط اقليمي مناطق مورد مطالعه، بايستي تصحيح گردد که این کار علاوه بر صرف زمان طولانی، هزينة زيادی را نیز طلب می­نماید (Chow، 1964).

دانشمندان با الهام از روشي كه طبيعت مسائل را حل و پيچيدگيها را خلق مي‌كند، سيستم‌هاي مصنوعي ايجاد كردند تا چگونگي حل مسئله خاصي را بدون دخالت بشري بيابند. اولين تلاشها در سال 1950 توسط فريدبرگ انجام گرفت، اما از آن زمان به بعد سيستم‌هاي پيشرفته‌تري گسترش يافتند كه نظريه داروين در سير تكامل طبيعي جهان مصنوعي از كامپيوترها و مدلسازي را بكار مي‌گيرند.

از موارد ويژه در اين زمينه الگوريتم‌هاي ژنتيك[1] (GAs) و برنامه‌ريزي ژنتيك[2] (GP) هستند؛ تكنيكهايي كه باعث رواج برنامه‌ريزي بيان ژن[3] (GEP)، يك سيستم فنوتيپ/ ژنوتيپ[4] شديداً تطبيق پذير، محسوب مي‌شوند. شيوة توابع تعريف شده به طور خودكار[5] (ADFs) در GEP بكار برده مي‌شود و مثال ديگري از تطبيق پذيري اين الگوريتم ماهر است. ADFs زمينه‌هاي جديدي براي ايجاد سيستم‌هاي يادگيري مصنوعي پيشرفته‌تر مي‌گشايد (Ferreira، 2006).

برنامه‌ريزي بيان ژن (GEP) نيز مانند الگوريتم‌هاي ژنتيك (GAs) و برنامه‌ريزي ژنتيك (GP)، يك الگوريتم ژنتيكي است بطوريكه از جمعيتي از افراد استفاده مي‌كند، آنها را مطابق برازندگي انتخاب مي‌كند و تغييرات ژنتيكي را با استفاده از يك يا چند عملگر ژنتيكي اعمال مي‌نمايد (Ferreira، 2001).

يكي از توانايي‌هاي روش GEP، ايجاد تنوع ژنتيكي است و از آنجائي كه عملگرهاي ژنتيكي در سطح كروموزومي عمل مي‌كنند، بي‌نهايت ساده شده است. در واقع به سبب ترتيب ساختاري از كروموزوم‌هاي GEP، هر گونه اصلاحات ايجاد شده در ژنوم، هميشه برنامه‌هاي درست و صحيحي را نتيجه مي‌دهد. توانايي ديگر GEP، طبيعت چند ژني بي‌همتاي آن است كه اجازه تكامل برنامه‌هاي پيچيده‌تر تشكيل شده از چندين زير برنامه را مي‌دهد (Ferreira، 2002).

از دهه 1960 توجه به روش‌هاي الهام گرفته از طبيعت، از جمله برنامه‌ريزي ژنتيك كه جزء محاسبات نرم معرفي مي‌شوند؛ جهت حل مسائل پيچيده افزايش يافت. برنامه‌ريزي ژنتيك عضوي از خانواده الگوريتم ژنتيك مي‌باشد كه توسط جان كُزا در سال 1992 بر اساس نظريه داروين ارائه شد. با توجه به تحقيقات انجام شده GP روشي مناسب براي مدلسازي فرايندهاي غيرخطي و پيچيده مي ‌باشد.

GP يك تكنيك برنامه‌ريزي خودكار مي‌باشد كه راه‌حل مسئله را با استفاده از برنامه‌نويسي كامپيوتر ارائه مي‌كند. مزيت GP نسبت به مدل‌هاي ديگر مثل شبكه‌هاي عصبي اين است كه در GP ابتدا ساختار بلوك‌ها (متغيرهاي ورودي، هدف و مجموعه توابع) تعريف شده و سپس ساختار بهينه مدل و ضرايب طي فرايند آموزش تعيين مي‌شوند. همچنين GP به طور خودكار مي‌تواند متغيرهاي ورودي كه در مدل بيشترين تأثير را دارند انتخاب كند.

برنامه‌ريزي ژنتيك بر خلاف الگوريتم ژنتيك روي شاخه‌هاي مجزا به جاي سلسله ارقام دودوئي عمل مي‌كند. شاخه‌هاي مجزا از مجموعه توابع (عملگرهاي پايه‌اي مورد استفاده در تابع) و ترمينال‌ها (متغيرهاي مسئله) ايجاد مي‌شود. تحقيقات گذشته نشان مي‌دهد كه در استفاده از محاسبات نرم (مثل برنامه‌ريزي ژنتيك و شبكه‌هاي عصبي و غیره) به بعضي از مشكلات مدل‌هاي فيزيكي غلبه مي ‌شود.

در این تحقیق، به منظور بررسی کارآیی روش برنامه­ریزی بیان ژن (GEP) برای پیش بینی رواناب سالانه رودخانه کرگانرود، از داده­هاي رواناب مشاهده­ای، بارش و نیز شاخص های دمای سالانه حوضه در دورة آماري مشترک 30 ساله استفاده شده و در نهایت مناسب­ترین ترکیب ورودی ها تعیین گردیده است. نتايج به دست آمده از اين پژوهش مي­­تواند برای حوضه ­اي فاقد آمار رواناب به کار گرفته شود.

  • مواد و روش‌ها

2-1- معرفی محدوده مورد مطالعه

ﺣﻮﺿﻪ آﺑﺮﯾﺰ ﮐﺮﮔﺎﻧﺮود در ﻣﺤﺪودة ﺟﻐﺮاﻓﯿﺎﯾﯽ 48 درﺟﻪ و 32 دﻗﯿﻘﻪ ﺗﺎ 48 درﺟﻪ و 55 دﻗﯿﻘﻪ ﻃﻮل ﺷﺮﻗﯽ و 37 درﺟﻪ و 42 دﻗﯿﻘﻪ ﺗﺎ 37 درﺟﻪ و 55 دﻗﯿﻘﻪ ﻋﺮض ﺟﻐﺮاﻓﯿﺎﯾﯽ ﻧﯿﻤﮑﺮه ﺷﻤﺎﻟﯽ ﮔﺴﺘﺮده ﺷﺪه اﺳﺖ. اﯾﻦ ﺣﻮﺿﻪ از ﻧﻈﺮ ﺗﻘﺴﯿﻤﺎت ﮐﺸﻮري در اﺳﺘﺎن ﮔﯿﻼن و ﺷﻬﺮﺳﺘﺎن ﺗﺎﻟﺶ ﻗﺮار ﮔﺮﻓﺘﻪ و وﺳﻌﺖ ﺣﻮﺿﻪ آﺑﺮﯾﺰ آن تا دریا ﺣﺪود 592 ﮐﯿﻠﻮﻣﺘﺮﻣﺮﺑﻊ ﻣﯽ ﺑﺎﺷﺪ. ﻣﻨﻄﻘﻪ ﻣﻮرد مطالعه، از ﺷﻤﺎل ﺑﻪ ﺣﻮﺿﻪﻫﺎي آﺑﺮﯾﺰ ﻟﯿﺴﺎر و ﻧﯿﻠﺮود ﺟﻮﮐﻨﺪان، از ﺷﺮق ﺑﻪ درﯾﺎي ﺧﺰر، از ﻏﺮب ﺑﻪ ﺣﻮﺿﮥ آﺑﺮﯾﺰ آرﭘﺎﭼﺎي و از ﺟﻨﻮب ﺑﻪ ﺣﻮﺿﻪﻫﺎي آﺑﺮﯾﺰ ﺗﯿﺰرود و ﻧﺎورود ﺧﺘﻢ ﻣﯽﺷﻮد (ﺷﮑﻞ 1).

رودﺧﺎﻧﮥ ﮐﺮﮔﺎﻧﺮود از ارﺗﻔﺎﻋﺎت ﻏﺮب ﺷﻬﺮﺳﺘﺎن ﺗﺎﻟﺶ ﺑـﺎ ﺣـﺪاﮐﺜﺮ ارﺗﻔـﺎع 3290 ﻣﺘـﺮ ﺳﺮﭼﺸـﻤﻪ ﮔﺮﻓﺘﻪ و از بهم ﭘﯿﻮﺳﺘﻦ دو رودﺧﺎﻧـﻪ ﺳـﻮره­­ﭼـﺎي و ﺳـﻠﻪ­ﯾـﻮرودي در آﺑـﺎدي آق­اوﻟـﺮ واﻗـﻊ در 23 ﮐﯿﻠﻮﻣﺘﺮي ﻏﺮب ﺷﻬﺮ تالش ﺗﺸﮑﯿﻞ ﻣﯽﮔﺮدد. اﯾﻦ رودﺧﺎﻧﻪ ﮐﻪ داﺋﻤﯽ و ﭘﺮآب اﺳﺖ، در ﺟﻬﺖ ﻏﺮب ﺑﻪ ﺷﺮق ﺟﺮﯾﺎن داشته و در ﻧﻬﺎﯾﺖ ﺑﻪ درﯾﺎي ﺧﺰر ﻣﯽرﯾﺰد. ﻃﻮل ﺷـﺎﺧﮥ اﺻـﻠﯽ رودخانه تا دریا ﺣﺪود 52 ﮐﯿﻠﻮﻣﺘﺮ و ﺷﯿﺐ ﻣﺘﻮﺳﻂ ﺑﺴﺘﺮ آن در ﮐﻮﻫﺴﺘﺎن 3 درﺻﺪ و در ﺟﻠﮕﻪ 1 درﺻﺪ ﻣﯽﺑﺎﺷﺪ.

2-2- منابع آماری مورد استفاده

در این تحقیق، از اطلاعات ایستگاه هیدرومتری «ماشین خانه» و داده­های ایستگاههای تبخیرسنجی «هشتپر تالش»، بارانسنجی «ماشین خانه» و بارانسنج ذخیره­ای «آق اولر» واقع در داخل حوضه مورد مطالعه و همچنین 4 ایستگاه هواشناسی دیگر در اطراف حوضه شامل ایستگاه سینوپتیک «خلخال» و تبخیرسنجی «خرجگیل»، «خلیان» و «ناو» استفاده گردیده است (شکل 2).

قابل ذکر است که دو ایستگاه سینوپتیک «تالش» و بارانسنجی «شیلاوشت» به دلیل نداشتن طول دوره آماری کافی، از دور خارج گردیدند. داده ­های آماری مورد استفاده در این تحقیق، شامل بارندگی، شاخص های درجه حرارت سه گانه و رواناب سالانه حوضه در یک دوره آماری مشترک 30 ساله (از سال آبي 66-65 لغايت 95-94) می­باشند.

شکل 1- موقعیت حوضه آبریز کرگانرود در استان گیلان و کشور ایران     شکل2- موقعیت ایستگاههای آب و هواشناسی مورد مطالعه

 2-2-1- بارندگی

جهت برآورد متوسط بارندگی سالانه حوضه، ابتدا با استفاده از داده­های بارندگی موجود و بازسازی شده ایستگاههای منتخب و ارتفاع آنها از سطح دریا و بکارگیری قابلیت­های نرم افزار EXCEL، روابط گرادیان بارندگی با انتخاب مناسب ترین معادله (خطی، توانی و یا نمایی) برای تمامی سالهای آماری مورد مطالعه تعیین و سپس با استفاده از این روابط و جایگذاری متوسط ارتفاع حوضه در معادلات مربوطه، مقادیر بارندگی ها محاسبه گردید.

 2-2-2- درجه حرارت

جهت برآورد شاخصهای حرارتی سالانه حوضه، ابتدا پس از بازسازی و تکمیل داده­های درجه حرارت ناقص ايستگاههاي منتخب در دوره آماری 30 ساله از روش تفاضل­ها، روابط دو شاخص حـرارتي متوسط حداکثر و حداقل سالانه با ارتفاع از سطح دریا با بکارگیری قابلیت­های نرم افزار  EXCELبه صورت معادلات خطی تعیین و سپس با استفاده از این روابط و جایگذاری متوسط ارتفاع حوضه در معادلات مربوطه، مقادیر این شاخص­ها و از میانگین آنها مقادیر شاخص متوسط درجه حرارت سالانه حوضه محاسبه گردید.

 2-2-3- دبی رواناب

به منظور تعیین میزان دبی رواناب خروجی از حوضه آبریز کرگانرود در طول دوره آماری 30 ساله، از داده های کامل و بدون نقص مشاهداتی در ایستگاه هیدرومتری ماشین خانه که بر روی رودخانه کرگانرود و در محل ورود به دشت واقع گردیده و معرف خوبی برای رواناب تولیدی حوضه می باشد، استفاده گردید.

2-3- ساختار روش برنامه­ریزی بیان ژن (GEP)

پس از آماده­سازی داده­های بارندگی و شاخص­­های حرارتی سه گانه شامل حداکثر، حداقل و میانگین درجه حرارت هوا که متغیرهاي اصلی و موثر ورودی مدل را تشکیل می­دهند و همچنین داده­های رواناب سالانه رودخانه کرگانرود که به عنوان تنها متغیرخروجی مدل محسوب می­گردد، به منظور بررسی کارآیی و میزان توانمندی روش برنامه­ریزی بیان ژن (GEP) در تخمین رواناب سالانه حوضه کرگانرود، از نرم افزار قدرتمند (GeneXproTools4)، استفاده گردید.

در این رابطه، اطلاعات 21 سال اول براي آموزش مدل و 9 سال باقي ­مانده براي صحت­سنجی آن در نظر گرفته شد. سپس به منظور شناسایی ورودیهای مؤثر، تعداد 8 الگوی مختلف بر اساس تركيب داده­هاي ورودی، طراحی و در نهایت، برای تعیین مناسب­ترین رابطه جهت پیش­بینی رواناب حوضه، از دو شاخص معتبر جذر میانگین مربعات خطا (RMSE) و ضریب همبستگی (2R) استفاده گردید.

2-3-1- روند پیش­بینی رواناب

روند پیش بینی با استفاده از برنامهريزي بيان ژن را به طور خلاصه ميتوان به 5 مرحله تقسيم نمود:

  • مرحله نخست شامل تعيين تابع برازش است. براي يك برازش كامل مقدار از يك برنامة انفرادي  برابر با  خواهد بود. در اين تحقيق طول محدوده انتخابي برابر با 100 () و مجموعهاي شامل تعداد 10 برازش () انتخاب گرديده است؛ بنابراين مقدار تابع برازش برابر با 1000 خواهد بود (). مزيت اين نوع تابع برازش اين است كه سيستم ميتواند با استفاده از آن، راه حل بهينه را پيدا كند. جذر ميانگين مربعات خطا (RMSE)، به عنوان معيار خطاي تابع برازش انتخاب شده است.

 مرحله دوم شامل انتخاب مجموعه ترمينالها و مجموعه توابع براي ايجاد كروموزومها است.

  (1)

كه در آن ورودي بعدي شامل متغيرهاي  و متغير خروجي است.

در پیش بینی رواناب، ميتواند مقادير ورودی شامل رواناب، بارش و شاخص­های سه گانه دما بوده و مقادیر رواناب می­باشد. پس مجموعه ترمينالها شامل متغيرهاي مستقل بدين صورت است:

  (2)

 كه در آن Qt رواناب در زمان ، T(max)t، T(avg)t و T(min)t به ترتیب متوسط حداکثر، میانگین و متوسط حداقل دما در زمان  و pt میانگین بارش در زمان  می باشد. در پژوهشهاي مختلف توابع متفاوتي جهت آموزش مدل در نظر گرفته شده اما تقريباً در تمامي موارد از عملگرهاي اصلي حسابي استفاده شده است. در اين تحقيق نيز چهار عملگر اصلي حسابي يعني{/ ,+ , – ,×} به عنوان مجموعه توابع در نظر گرفته شده است.

  • مرحله سوم انتخاب ساختار كروموزومها مي­باشد كه شامل طول سر و تعداد ژنها است. طول سر برابر با 8 () انتخاب شده و تعداد 3 ژن نيز در هر كروموزوم در نظر گرفته شده است. همچنين در هر اجرا تعداد 30 كروموزوم انتخاب گرديده است.
  • مرحله چهارم انتخاب تابع پيوند است كه تعيين كننده ارتباط بين زيردرختها مي­باشد. در اين بررسي سه ژن انتخابي (زير درختها يا همان ETs) از طريق تابع مجموع به هم پيوند داده ميشوند.
  • مرحله پنجم، انتخاب عملگرهاي ژنتيكي و نرخ آنهاست. در اين مورد تركيبي از كليه عملگرهاي بهسازي از قبيل جهش، وارون سازي، سه نوع ترانهش و سه نوع تركيب استفاده شده است. پارامترهاي مورد استفاده و نرخ آنها در استخراج مدلهاي پیش بینی رواناب در مقياسهاي زماني مختلف در جدول 1 بطور خلاصه ارائه شده است.

 

جدول 1- مقادير پارامترهاي مورد استفاده در شبيه سازي رواناب با استفاده از GEP

مقدار پارامتر
7 (Head Size)اندازه سر
30 (Chromosomes)تعداد كروموزوم‌ها
3 (Number of genes)تعداد ژن‌ها در هر كروموزوم
0.044 (Mutation Rate)نرخ جهش
0.1 (Inversion Rate)نرخ وارون‌سازي
0.3 (One-Point Recombination Rate)نرخ تركيب تك-نقطه‌اي
0.3 (Two-Point Recombination Rate)نرخ تركيب دو-نقطه‌اي
0.1 (Gene Recombination Rate)نرخ تركيب ژن
0.1 (IS Transposition Rate)نرخ ترانهش درج متوالي
0.1 (RIS Transposition Rate)نرخ ترانهش ريشه درج متوالي
0.1 (Gene Transposition Rate)نرخ ترانهش ژن
RMSE (Fitness Function Error Type)معيار خطاي تابع برازش
جمع (+) (Linking Function)تابع پيوند

 

2-3-2- آموزش برنامه (Training)

براي دست­یابی به برنامه و ساختاری که بتواند روابط بین ورودی­ها و خروجی مدل را تعمیم دهد، لازم است برنامه آموزش داده شود. چون قوانين خاصي براي این کار وجود ندارد، ناگزیر چندين ساختار مورد بررسي قرار گرفته و پارامترهای ورودي و خروجي به دو دسته تقسيم گردیدند. در این رابطه، اطلاعات 21 سال اول دورة شاخص آماری (70 درصد)، براي آموزش برنامه و 9 سال باقي­مانده (30 درصد)، براي صحت­سنجی آن به كار گرفته شد.

به منظور شناسایی ورودی­های مؤثر در پیش­بینی رواناب حوضه، بر اساس دسته­بندی جدول 2، تعداد 8 الگوی مختلف بر اساس تركيب داده­هاي بارندگي و سه شاخص متوسط حداكثر، حداقل و ميانگين درجه حرارت طراحی گردید.

جدول 2- الگوهای ورودی­ مختلف جهت پیش­بینی مقدار رواناب حوضه

الگوهای ورودی مختلف ردیف
Q-P بارش رواناب – 1
Q-P,Tavg  بارش، میانگین دما رواناب – 2
Q-P,Tmax  بارش، متوسط حداکثر دما رواناب – 3
Q-P,Tmin  بارش، متوسط حداقل دما رواناب – 4
Q-P,Tmin ,Tmax  بارش، متوسط حداقل دما، متوسط حداکثر دما رواناب – 5
Q-P,Tavg ,Tmax  بارش، میانگین دما، متوسط حداکثر دما رواناب – 6
Q-P,Tavg ,Tmin  بارش، میانگین دما، متوسط حداقل دما رواناب – 7
Q-P,Tavg ,Tmax,Tmin بارش، میانگین دما، متوسط حداکثر دما، متوسط حداقل دما رواناب – 8
 

2-3-3- صحت سنجی برنامه (Testing)

از آنجایی که بررسی عمل­کرد برنامه­ریزی بیان ژن و به عبارت دیگر بررسی کارآیی و میزان دقت آن در پیش­بینی­های متفاوت، نیاز به تحلیل حساسیت پارامترهای ورودی و در نهایت تعیین مناسب­ترین ساختار ورودی­ها دارد، برای این منظور، لازم است با بهره­گیری از شاخص­های آماری رایج، مناسب­ترین ساختار و در نهایت رابطه مربوطه استخراج گردد. در فرآیند عملیاتی برنامه­ریزی بیان ژن، دو شاخص معتبر جذر میانگین مربعات خطا (RMSE) و ضریب همبستگی (2R) به عنوان معيار خطاي تابع برازش انتخاب گردیده است.

 2-3-3-1- شاخص جذر میانگین مربعات خطا (RMSE)

رابطه این شاخص به صورت زیر تعریف شده است:

(3)

: داده­هاي مشاهداتي

: داده­هاي پیش بینی شده

N : تعداد کل مشاهدات

RMSE اختلاف بين مقادیر مشاهده­ای و محاسباتی را نشان داده و هرچه قدر به صفر نزدیک­تر باشد، بیانگر دقیق­تر بودن مقادیر پیش­بینی شده خواهد بود.

 

2-3-3-2- شاخص ضریب همبستگی (2R)

رابطه این شاخص به صورت زیر تعریف شده است:

 

(4)

: داده­هاي مشاهداتي

: داده­هاي پیش بینی شده

R2 میزان وابستگی بين مقادیر مشاهده­ای و محاسباتی را نشان داده و هرچه قدر به یک نزدیک­تر باشد، بیانگر بالا بودن میزان همبستگی بین مقادیر خواهد بود.

3- نتايج و بحث

پس از آموزش کامل مدل برنامه­ریزی بیان ژن با استفاده از 8 ساختار ورودی مختلف (Training)، مقادیر رواناب پیش­بینی شده توسط مدل در مرحله صحت­سنجی (Testing) با مقادیر رواناب مشاهداتی در ایستگاه هیدرومتری ماشین خانه، توسط شاخص­های RMSE و R2 مورد مقایسه قرار گرفت. جهت دستیابی به نتایج منطقی و سنجش دقیق میزان توانمندی مدل مورد استفاده در ساختارهای ورودی مختلف، مرحله آموزش مدل در تمامی ساختارها تا رسیدن شاخص Best Fitnes (همپوشانی مقادیر مشاهداتی و محاسباتی) به حداقل 80% و همچنین شاخص R-Squre به حداقل 90% تداوم یافت.

بر اساس نتایج بدست آمده در جدول 4، مقادیر مناسب دو شاخص آماری و نزدیک بودن آنها در تمامی ساختارها، به خوبی نشان می­دهد که با ترکیب داده­های ورودی در حالات مختلف، آموزش مدل به خوبی و با دقت بالایی صورت گرفته است. بطوری که مشاهده می­گردد، نتایج بدست آمده بر اساس شاخصR2، همبستگی قابل قبولی را بین داده­های پیش­بینی شده و مشاهده­ای در ساختارهای مختلف تأیید می­نماید.

جهت تعیین مناسب­ترین ساختار در بین الگوهای مختلف، شاخص­ RMSE را مورد بررسی قرار داده که نتایج آن به خوبی نشان می­دهد، این شاخص­ در الگوی 8 با رقم 0.376، کمترین مقدار را داشته و در نتیجه بهترین همپوشانی را بین داده­های پیش­بینی شده و مشاهده­ای تأیید می­کند. بنابراین، الگوی 8 با ترکیب چهار پارامتر میانگین بارندگی، متوسط حداکثر، حداقل و میانگین دما، مناسب­ترین ساختار ورودی برای پیش­بینی رواناب حوضه محسوب می­شود.

در شکل 3، مرحله پردازش اطلاعات (RUN) در محیط نرم افزار GeneXproTools4 نشان داده شده است. پس از مشخص شدن مناسب­ترین ساختار ورودی­های مدل انتخابی جهت تخمین رواناب سالانه حوضه، با استفاده از قابلیت­های نرم­افزار GeneXproTools4، رابطه بین پارامتر خروجی (رواناب) و پارامترهای ورودی­ مدل شامل بارش، متوسط حداکثر، حداقل و میانگین دما با استفاده از زبان برنامه­نویسی MATLAB و بکارگیری چهار عملگر اصلي حسابي يعني{/,+, -, ×}، استخراج گردید. رابطه نهایی بدست آمده به صورت زیر است:

(5)

Q: میانگین دبی رواناب سالانه بر حسب مترمکعب در ثانیه

 P: متوسط بارندگی سالانه بر حسب صدميلي­متر

 Tmax: متوسط حداکثر درجه حرارت سالانه بر حسب درجه سانتی­گراد

 Tavg: میانگین درجه حرارت سالانه بر حسب درجه سانتی­گراد

Tmin: متوسط حداقل درجه حرارت سالانه بر حسب درجه سانتی­گراد

جدول 4- عملکرد مدل برنامه­ریزی بیان ژن در تخمین رواناب سالانه حوضه

مرحله صحت سنجی مرحله آموزش  

ساختارها و الگوهای ورودی

Best Fitness R2 RMSI Best Fitness R2 RMSI
0/736 0/961 0/601 0/820 0/952 0/385 رواناب، بارش 1
0/754 0/952 0/546 0/805 0/942 0/426 رواناب،  بارش، میانگین دما 2
0/735 0/951 0/604 0/803 0/941 0/432 رواناب،  بارش، متوسط حداکثر دما 3
0/644 0/837 0/929 0/847 0/968 0/317 رواناب،  بارش، متوسط حداقل دما 4
0/750 0/958 0/559 0/815 0/950 0/397 رواناب،  بارش، متوسط حداقل دما، متوسط حداکثر دما 5
0/736 0/927 0/601 0/836 0/962 0/345 رواناب،  بارش، میانگین دما، متوسط حداکثر دما 6
0/794 0/946 0/435 0/823 0/955 0/377 رواناب،  بارش، میانگین دما، متوسط حداقل دما 7
0/817 0/966 0/376 0/832 0/959 0/354 رواناب، بارش، میانگین دما، متوسط حداکثر دما، متوسط حداقل دما 8

شکل 3 مرحله پردازش اطلاعات (RUN) در محیط نرم افزار GeneXproTools4

4- نتیجه­ گیری و پیشنهاد

مهم­ترین ﻧﺘﺎﯾﺞ ﺑﺪﺳﺖ آﻣﺪه در تحقیق حاضر را می­توان در موارد زﯾﺮ ﺑﯿﺎن ﻧﻤﻮد:

  • مناسب­ترين ساختار ورودي­ها جهت تخمین رواناب سالانه حوضه آبریز کرگانرود با استفاده از مدل برنامه­ریزی بیان­ژن (GEP)، ترکیب چهار پارامتر اقلیمی مهم شامل بارندگی، متوسط حداکثر، حداقل و میانگین دمای سالانه حوضه مي­باشد.
  • در بین سه شاخص حرارتی سالانه، متوسط حداقل دما کمترین نقش را در میزان رواناب سالانه دارد.
  • در بین سه شاخص حرارتی سالانه، میانگین دمای سالانه بیشترین تأثیر را در میزان رواناب سالانه دارد.
  • آموزش مدل برنامه­ریزی بیان­ژن برای تمامی الگوهای ورودی، با دقت بسیار بالایی صورت می­گیرد.
  • بیشترین میزان همبستگی بین داده­های رواناب مشاهد­ه­ای و رواناب محاسباتی توسط مدل برنامه­ریزی بیان­ژن، مربوط به ساختار منتخب (الگوی شماره 8) و دارای ضریب همبستگی (=9662R) می­باشد.
  • کمترین میزان خطای محاسبه شده توسط مدل برنامه­ریزی بیان­ژن جهت پيش ­بيني رواناب سالانه حوضه کرگانرود، در الگوی شماره 8 با (RMSE=0.376­) مشاهده گردید.
  • بالاترین میزان همپوشانی بین داده­های رواناب مشاهد­ه­ای و رواناب محاسباتی توسط مدل برنامه­ریزی بیان­ژن، به الگوی شماره 8 با (Best Fitness= 0.817) تعلق دارد.
  • به طور کلی می­توان گفت که مدل برنامه­ریزی بیان­ژن (GEP) برای پیش­بینی رواناب سالانه حوضه از دقت بسیار بالایی برخوردار بوده و با توجه به بالابودن سرعت و میزان دقت این مدل در مقایسه با سایر مدل­های رایج و همچنین امکان استخراج رابطه ریاضی بین پارامترهای ورودی­ و خروجی در این مدل، پیشنهاد می­گردد، این روش در حوضه­های آبریز معرف بکار گرفته شده و از نتایج آن برای تخمین آورد حوضه­های آبریز فاقد آمار استفاده گردد.

منابع

  1. فضل اولي، ر.، آخوندعلي، م. ع. و بهنيا، ع. (1385)، تعيين روابط پيش­بيني رواناب در حوضه­هاي آبريز كوهستاني (مطالعه موردي: حوضه­هاي آبريز معرف امامه و كسيليان)، مجله علوم كشاورزي و منابع طبيعي، 13 (6): 13-1.
  2. محمدی فتیده، م. (1379)، استخراج آبهاي زيرزميني، انتشارات دانشگاه گیلان.
  3. Chow V.T. 1964. Handbook of Applied Hydrology, Mc-Graw Hill Book Company, New York, USA, 1418 pp
  4. Ferreira, C. 2001. Gene expression programming: a new adaptive algorithm for solving problems. Complex Systems, 13(2), 87-129.
  5. Ferreira, C. 2002a. Genetic representation and genetic neutrality in gene expression programming. Advances in Complex Systems, 5(4), 389-408.
  6. Ferreira, C. 2006. Automaticlly defined functions in gene expression programming. In: Nedjah, N., Mourelle, L.M., Abraham, A. (Eds.), Genetic Systems Programming: Theory and Experiences, Studies in Computational Intelligence, Springer-Verlag, 13, 21-5

اشتراک:

درباره نویسنده

نظرات بسته اند

برچسب‌ها : % % % % % % % % % % % % % % %