تعزيز التعلم في أنظمة التداول الأسهم عبر الإنترنت


تعزيز التعلم في أنظمة تداول الأسهم عبر الإنترنت
الحصول على فيا أب ستور قراءة هذه المشاركة في التطبيق لدينا!
ما هو المتكررة التسليح التعلم.
جاء مؤخرا عبر كلمة "المتكررة تعزيز التعلم". أنا أفهم ما "الشبكة العصبية المتكررة" وما هو "تعزيز التعلم" هو، ولكن لا يمكن العثور على الكثير من المعلومات حول ما "المتكررة تعزيز التعلم" هو.
هل يمكن لشخص ما أن يشرح لي ما هو "التعلم المتكرر التعزيز" وما هو الفرق بين "المتكررة تعزيز التعلم" و "التعلم التعزيز" العادي مثل Q - التعلم خوارزمية.
ما هو "التعلم المتكرر التعزيز"
تم إدخال التعلم التعزيز المتكرر (رل) لأول مرة لتدريب أنظمة التداول الشبكي العصبي في عام 1996 (يعني المتكرر أن الإخراج السابق يتم إدخاله في النموذج كجزء من المدخلات). وسرعان ما امتد إلى التداول في سوق الفوركس.
وقد تم العثور على تقنية رل لتكون تقنية التعلم الآلي ناجحة لبناء أنظمة التداول المالي.
ما هو الفرق بين "المتكررة التسليح التعلم" و "التعلم التعزيز" العادي مثل Q - التعلم خوارزمية.
يختلف نهج رل بشكل واضح عن البرمجة الديناميكية وخوارزميات التعزيز مثل التعلم التدريجي والتعلم Q، والتي تحاول تقدير دالة قيمة لمشكلة التحكم.
إطار رل يسمح لخلق تمثيل المشكلة بسيطة وأنيقة، يتجنب لعنة بلمان من الأبعاد ويقدم مزايا مقنعة في الكفاءة:
تنتج رل إجراءات قيمة حقيقية) أوزان الحافظة (بشكل طبيعي دون اللجوء إلى طريقة التقسيم في التعلم Q.
رل لديها أداء أكثر استقرارا بالمقارنة مع التعلم Q عندما تتعرض لمجموعات البيانات صاخبة. خوارزمية Q - التعلم هو أكثر حساسية لاختيار وظيفة قيمة (ربما) بسبب خاصية العودية من التحسين الديناميكي، في حين خوارزمية رل أكثر مرونة في اختيار وظيفة موضوعية وتوفير الوقت الحسابي.
مع رل، يمكن تحسين أنظمة التداول من خلال تعظيم وظائف الأداء، U ()، مثل الربح (العائد بعد تكاليف المعاملة)، والثروة، وظائف فائدة الثروة أو معدلات الأداء المعدلة المخاطر مثل نسبة شارب.
التمييز (عميق) رل المتكررة، هو أن وظيفة تعيين وكلاء الملاحظات إلى عمل إخراجها هو شبكة العصبية المتكررة.
الشبكة العصبية المتكررة هي نوع من الشبكة العصبية التي تعالج كل مراقبة بالتتابع، بنفس الطريقة لكل خطوة زمنية.

تعزيز التعلم لنظم التداول والمحافظ: فوري مقابل المكافآت المستقبلية.
جون مودي ماثيو سافيل يوانسونغ لياو لي تشونغ وو.
ونحن نقترح تدريب أنظمة التداول والمحافظ من خلال تحسين وظائف الهدف المالي عن طريق تعزيز التعلم. وظائف الأداء التي نعتبرها وظائف قيمة هي الربح أو الثروة، ونسبة شارب ونسبة التفاضلية المقترحة مؤخرا شارب للتعلم عبر الإنترنت. في مودي & أمب؛ وو (1997)، قدمنا ​​نتائج تجريبية في تجارب مضبوطة أثبتت فاعلية بعض طرقنا لتحسين نظم التداول. ونحن هنا نقدم عملنا السابق لاستخدام Q - التعلم، وتقنية التعلم التعزيز الذي يستخدم المكافآت في المستقبل القريب لاختيار الإجراءات، ومقارنة أدائها إلى أن من النظم السابقة التي يتم تدريبها لتحقيق أقصى قدر من المكافأة الفورية. كما نقدم نتائج المحاكاة الجديدة التي تدل على وجود إمكانية التنبؤ في مؤشر S & أمب؛ P 500 الأسهم الشهري لفترة 25 سنة 1970 حتى 1994.
المراجع.
معلومات حقوق التأليف والنشر.
المؤلفين والانتماءات.
جون مودي 1 ماثيو سافيل 1 يوانسونغ لياو 1 ليتونغ وو 1 1. كس قسم أوريغون معهد الدراسات العليا بورتلاند الولايات المتحدة الأمريكية.
حول هذا الفصل.
توصيات شخصية.
استشهد الفصل.
المراجع المرجعية ريس ريفوركس زوتيرو.
.BIB بيبتكس جابريف منديلي.
حصة الفصل.
تحميل فوري للقراءة على جميع الأجهزة التي تملكها إلى الأبد ضريبة المبيعات المحلية وشملت إذا كان ذلك ساريا.
استشهد الفصل.
المراجع المرجعية ريس ريفوركس زوتيرو.
.BIB بيبتكس جابريف منديلي.
حصة الفصل.
أكثر من 10 مليون وثيقة علمية في متناول يدك.
تبديل الطبعة.
&نسخ؛ 2017 سبرينجر الدولية للنشر أغ. جزء من الطبيعة سبرينجر.

تعزيز التعلم للتجارة المالية الآلي: الأساسيات والتطبيقات.
فرانشيسكو بيرتولوزو مؤلف البريد الإلكتروني ماركو كورازا.
إن بناء أنظمة التداول الآلي الآلي (فتس) هو موضوع اهتمام كبير لكل من البيئة الأكاديمية والمالية بسبب الوعود المحتملة من خلال منهجيات التعلم الذاتي. في هذه الورقة نعتبر خوارزميات نوع التعزيز التعلم (رل)، وهذا هو الخوارزميات التي في الوقت الحقيقي تحسين سلوكهم فيما يتعلق بالردود التي يحصلون عليها من البيئة التي تعمل فيها، دون الحاجة إلى المشرف. على وجه الخصوص، أولا نحن نقدم الجوانب الأساسية من رل التي هي ذات فائدة لأغراضنا، وثانيا نقدم بعض فتس التلقائي الأصلي على أساس خوارزميات تستند رل على أساس مختلف، ثم نطبق هذه فتس إلى سلسلة الوقت الاصطناعي والحقيقي من أسعار الأسهم اليومية . وأخيرا، نقارن مؤشراتنا المالية (فتس) مع مؤشر كلاسيكي واحد يستند إلى مؤشرات التحليل الفني. جميع النتائج التي نحققها هي عموما مرضية تماما.
معاينة.
المراجع.
معلومات حقوق التأليف والنشر.
المؤلفين والانتماءات.
فرانشيسكو بيرتولوزو 1 كاتب البريد الإلكتروني ماركو كورازا 1 2 1. قسم الاقتصاد كا 'فوسكاري جامعة البندقية البندقية إيطاليا 2. مدرسة متقدمة للاقتصاد في البندقية كا' فوسكاري جامعة البندقية البندقية إيطاليا.
حول هذه الورقة.
توصيات شخصية.
استشهد ورقة.
المراجع المرجعية ريس ريفوركس زوتيرو.
.BIB بيبتكس جابريف منديلي.
مشاركة الورقة.
تحميل فوري للقراءة على جميع الأجهزة التي تملكها إلى الأبد ضريبة المبيعات المحلية وشملت إذا كان ذلك ساريا.
استشهد ورقة.
المراجع المرجعية ريس ريفوركس زوتيرو.
.BIB بيبتكس جابريف منديلي.
مشاركة الورقة.
أكثر من 10 مليون وثيقة علمية في متناول يدك.
تبديل الطبعة.
&نسخ؛ 2017 سبرينجر الدولية للنشر أغ. جزء من الطبيعة سبرينجر.

تعزيز التعلم لنظم التداول والمحافظ.
جون مودي وماثيو سافيل.
نقترح تدريب أنظمة التداول من خلال تحسين وظائف الهدف المالي عن طريق تعزيز التعلم. وظائف الأداء التي نعتبرها وظائف قيمة هي الربح أو الثروة، ونسبة شارب ونسبة التفاضلية المقترحة مؤخرا شارب للتعلم عبر الإنترنت. في مودي & أمب؛ وو (1997)، قدمنا ​​نتائج تجريبية في تجارب خاضعة للمراقبة أثبتت مزايا التعلم التعزيزي مقارنة بالتعليم الخاضع للإشراف. هنا نوسع عملنا السابق لمقارنة Q - التعلم إلى تقنية التعلم التعزيز على أساس التعلم في الوقت الحقيقي المتكررة (رترل) التي تعظيم المكافأة الفورية. وتشمل نتائج المحاكاة لدينا مظاهرة مذهلة من وجود القدرة على التنبؤ في ستاندرد ستاندرد وبورس 500 مؤشر الأسهم لفترة 25 سنة 1970 حتى 1994. لدينا التعزيز المتداول يحقق محاكاة خارج العينة ربح أكثر من 4000٪ لهذه الفترة، مقارنة بعائد شراء واستراتيجية حوالي 1300٪ (مع إعادة توزيع الأرباح). يتم تحقيق هذه النتيجة متفوقة مع مخاطر أقل بكثير.
هذه الصفحة محمية بحقوق الطبع والنشر من قبل آاي. كل الحقوق محفوظة. استخدامك لهذا الموقع يشكل قبول جميع شروط وأحكام وسياسة الخصوصية لشركة آي.

travel-persona. ru.
تعزيز التعلم في أنظمة التداول الأسهم عبر الإنترنت.
تعزيز التعلم في أنظمة التداول الأسهم عبر الإنترنت.
وتركز هذه الورقة على مشكلة تحديد استراتيجية الاستثمار من خلال استخدام تقنيات التعلم التعزيزية. واستخدمت أربع تقنيات، اثنان على أساس التعلم المتكرر التعزيز (رل) واثنين على أساس التعلم Q-. وقد أسفرت نتائج التعلم Q عن نتائج فازت باستمرار على استراتيجيات الشراء والاستحواذ على العديد من أسهم التكنولوجيا، في حين أن أساليب رل كانت في كثير من الأحيان غير متسقة وتتطلب المزيد. كيفراسراينيرفورسيمنت التعلم على الانترنت نظام تداول الأسهم الاستثمار تحديد استراتيجية تحليل مخاطر السوق العديد من التكنولوجيا الأسهم طريقة رل تحليل سوق الأسهم آلة التعلم إيدو تطبيق عقد استراتيجية التعزيز المتكرر محفظة التعلم الأمثل.
يوفر التعلم عبر الإنترنت الهائل تجميعا منهجيا للمعلومات المتعلقة بالخلفية والاتجاهات والقضايا والتصميم والتنفيذ والتقييم وتحقيق الدخل والقضايا القانونية والتوجهات المستقبلية للدورات التدريبية الشاملة عبر الإنترنت (موكس). أبستراكتنقترح لتدريب أنظمة التداول والمحافظ من خلال تحسين وظائف الهدف المالي عن طريق تعزيز التعلم.
وظائف الأداء التي نعتبرها وظائف قيمة هي الربح أو الثروة، ونسبة شارب ونسبة التفاضلية المقترحة مؤخرا شارب للتعلم عبر الإنترنت.

Comments