الخيار الشبكات العصبية ثنائي


ميتاتريدر 4 - نظم التداول الشبكة العصبية العميقة مع مرصوف الإدارة القائمة على النتائج. التدريب الذاتي، وضبط النفس هذا المقال هو استمرار مقالات سابقة على الشبكة العصبية العميقة واختيار تنبؤ. هنا سوف نقوم بتغطية ملامح الشبكة العصبية التي بدأها مرصوف الإدارة القائمة على النتائج، وتنفيذها في حزمة DARCH. كما سيتم كشف إمكانية استخدام نموذج ماركوف المخفية لتحسين أداء التنبؤ الشبكة العصبية. في الختام، سننفذ مستشار الخبراء التشغيلي برمجيا. المحتويات 1. هيكل DBN 2. إعداد واختيار البيانات 2.1. المتغيرات الإدخال 2.2. المتغيرات الانتاج 2.3. إطار البيانات الأولية 2.3.1. حذف المتغيرات المترابطة للغاية 2.4. اختيار من أهم المتغيرات 3. جزء التجريبية. 3.1. بناء نماذج 3.1.1. وصف موجز لحزمة DARCH 3.1.2. بناء نموذج DBN. المعلمات. 3.2. تشكيل نماذج التدريب والاختبار. 3.2.1. فصول الموازنة وما قبل المعالجة. 3.2.2. ترميز هدف متغير 3.3. تدريب نموذج 3.3.1. قبل التدريب 3.3.2. صقل 3.4. اختبار النموذج. etrics. 3.4.1. توقعات فك. 3.4.2. تحسين معايرة النتائج التنبؤ تجانس مع نموذج سلسلة ماركوف تصحيح إشارات توقع على منحنى التوازن النظري 3.4.3. مقاييس 4. هيكل مستشار الخبراء 4.1. وصف مستشار خبير الصورة العملية 4.2. التحكم الذاتي. تركيب وإطلاق طرق وأساليب تحسين مؤشرات نوعية التدريب الذاتي. الخاتمة مقدمة في إعداد البيانات لإجراء التجارب، وسوف نستخدم متغيرات من المادة السابقة حول تقييم واختيار تنبؤ. سنشكل العينة الأولية، تنظيفه وتحديد المتغيرات الهامة. سندرس سبل تقسيم العينة الأولية في التدريب والاختبار والتحقق من صحة العينات. باستخدام حزمة DARCH سوف نبني نموذجا للشبكة DBN، وتدريب على مجموعات لدينا من البيانات. بعد اختبار النموذج، سوف نحصل على المقاييس التي سوف تمكننا من تقييم نوعية النموذج. سننظر في العديد من الفرص التي توفرها هذه الحزمة إلى تكوين إعدادات الشبكة العصبية. أيضا، سوف نرى كيف يمكن لنماذج ماركوف المخفية يمكن أن تساعدنا في تحسين التنبؤات الشبكة العصبية. وسنعمل على وضع مستشار الخبراء حيث سيتم تدريب نموذج بشكل دوري على الطاير من دون انقطاع في التجارة، بناء على نتائج المراقبة المستمرة. سيتم استخدام نموذج DBN من حزمة DARCH في مستشار الخبراء. وسوف تشمل أيضا مستشار الخبراء التي تم إنشاؤها باستخدام SAE DBN من المادة السابقة. وعلاوة على ذلك، فإننا سوف تشير إلى طرق وأساليب تحسين المؤشرات النوعية للنموذج. 1. هيكل الشبكة العصبية العميقة تهيئة من قبل مرصوف الإدارة القائمة على النتائج (DN SRBM) وأذكر أن DN SRBM تتكون من ن عدد من الإدارة القائمة على النتائج التي يساوي عدد الطبقات الخفية للشبكة العصبية و، في الأساس، والشبكة العصبية نفسها. ويتألف التدريب على مرحلتين. تتضمن المرحلة الأولى قبل التدريب. يتم تدريب كل الإدارة القائمة على النتائج بشكل منظم دون المشرف على مدخلات مجموعة (بدون هدف). بعد هذا الوزن من طبقات مخفية، يتم نقلها إلى الإدارة القائمة على النتائج طبقات خفية ذات الصلة من الشبكة العصبية. المرحلة الثانية تتضمن صقل، حيث يتم تدريب الشبكة العصبية مع مشرف. وقدمت معلومات مفصلة عن ذلك في المادة السابقة، لذلك نحن دون ر داعي للتكرار أنفسنا هنا. وسوف أذكر ببساطة أن خلافا لحزمة deepnet التي استخدمناها في المادة السابقة، حزمة DARCH تساعدنا على تنفيذ فرص أوسع في بناء وضبط النموذج. وسيتم توفير المزيد من التفاصيل عند إنشاء نموذج. تين. 1 يبين هيكل وعملية التدريب من DN SRBM الشكل. 1. هيكل DN SRBM 2. إعداد واختيار البيانات 2.1. المتغيرات الإدخال (علامات، تنبئ) في المادة السابقة، ونحن قد نظرت بالفعل تقييم واختيار تنبؤ، لذلك ليس هناك حاجة لتقديم معلومات إضافية الآن. وسوف أذكر فقط أن كنا 11 مؤشرا (جميع مؤشرات التذبذب: ADX، AROON، ATR، CCI، chaikinVolatility، كبير المراقبين العسكريين، MACD و RSI، ستوتش، SMI، وتقلب). وقد تم اختيار العديد من المتغيرات من بعض المؤشرات. بهذه الطريقة وقد شكلنا مجموعة المدخلات من 17 المتغيرات. دعونا نلقي يقتبس من أشرطة 6000 الأخيرة على اليورو مقابل الدولار الأميركي، 30 كما في 14.02.16، وحساب قيم المؤشرات باستخدام وظيفة في (). سوف نحصل على مصفوفة البيانات المدخلة في الإخراج. بيانات 2.2 الإخراج (متغير الهدف) ومتغير الهدف نأخذ الإشارات التي تم الحصول عليها مع ZZ. وظيفة حساب خط متعرج وإشارة: مصفوفة السعر العلاقات العامة OHLCMed نقلت الحد الأدنى لطول CH رأي من منعطف متعرج في النقاط (4 علامات) أو من حيث القيمة الحقيقية (على سبيل المثال، الفصل 0.0035) وضع سعر طبق (م - المتوسطة، HL - ارتفاع وانخفاض البنود - انهيار)، وتستخدم المتوسطة افتراضيا. تقوم الدالة بإرجاع مصفوفة مع اثنين من المتغيرات في الواقع، ومتعرج، والإشارة، وحصلت على قاعدة من زاوية متعرجة في نطاق -1 1. نحن تحويل إشارة من شريط واحد إلى اليسار (نحو المستقبل). وسوف تستخدم هذه إشارة محددة لتدريب الشبكة العصبية. نحسب إشارات لZZ مع طول منحنى من 37 نقطة على الأقل (4 علامات). كما يمكننا أن نرى، والطبقات غير متوازنة قليلا. عند تشكيل عينات لتدريب نموذج، وسوف نتخذ التدابير اللازمة لمستوى أجبرتها على الفرار. 2.3. إطار البيانات الأولية دعونا نكتب وظيفة التي من شأنها خلق إطار البيانات الأولية، تنظيفه من قدم بيانات غير مؤكد (NA) وتحويل المتغير الهدف إلى عامل مع فئتين -1 و +1. يجمع بين هذه الوظيفة وظائف كتب سابقا في () وZZ (). وسوف المحاصيل على الفور 500 الحانات الأخيرة التي سيتم استخدامها لتقييم نوعية النموذج الصورة التنبؤ. 2.3.1. حذف المتغيرات المترابطة للغاية ونحن سوف تحذف المتغيرات مع معامل الارتباط فوق 0.9 من مجموعة أولية لدينا. وسوف نكتب وظيفة التي ستشكل الإطار البيانات الأولية، وإزالة المتغيرات المترابطة للغاية وإرجاع البيانات نظيفة. لا يمكننا التحقق مقدما المتغيرات التي لها ارتباط فوق 0.9. وهكذا، فإن المتغيرات المذكورة أعلاه تخضع لإزالة. وسوف حذفها من الإطار البيانات. سنكتب على أنها مضغوط في وظيفة واحدة: وافقت ليست كل الكتاب من الحزم والباحثون أن البيانات المترابطة للغاية وينبغي إزالتها من مجموعات. ومع ذلك، النتائج باستخدام كلا الخيارين ينبغي مقارنة هنا. في حالتنا، وسوف نختار الخيار مع حذف. 2.4. وسيتم اختيار مجموعة من أهم المتغيرات المتغيرات الهامة على أساس ثلاثة مؤشرات: أهمية عالمية، أهمية محلية (بالاشتراك)، وأهمية جزئية حسب الطبقة. سوف نغتنم الفرص لحزمة randomUniformForest كما هو مفصل في المادة السابقة. وسيتم جمع جميع الإجراءات السابقة واللاحقة في وظيفة واحدة لالاكتناز. مرة واحدة أعدموا، سوف نحصل على ثلاث مجموعات نتيجة لذلك: مع أفضل المتغيرات في الإسهام والتفاعل مع المتغيرات أفضل للطبقة -1 مع أفضل المتغيرات للفئة 1. سنقوم توضيح ترتيب العمليات الحسابية وظيفة. المعلمات الرسمية: ن المدخلات المعلمة بيانات المعلمة البيانات ض الانتاج عتبة قطع ارتباط البيانات طريقة المتغيرات طريقة إدخال ما قبل المعالجة. ترتيب العمليات الحسابية: إنشاء مجموعة الأولي من data. f، الذي يرتبط بعلاقة متبادلة المتغيرات إزالتها، وحفظه لاستخدامها مرة أخرى تحديد مؤشرات للتدريب واختبار عينات من IDX تحديد المعلمات قبل تجهيز الإعدادية تقسيم العينة الأولية في التدريب و عينات الاختبار، وتطبيع البيانات المدخلة الحصول على اختبار نموذج الجبهة على مجموعات الحصول على حساب أهمية imp. ruf المتغيرات حدد 10 المتغيرات الأكثر أهمية من حيث المساهمة والتفاعل الأفضل اختيار 7 المتغيرات الأكثر أهمية بالنسبة لكل فئة -1 و 1 أفضل . شراء، best. sell إنشاء قائمة مع ثلاث مجموعات من تنبؤ أفضل، best. buy، best. sell. وسوف نقوم بحساب هذه العينات وتقييم القيم ذات الأهمية العالمية والمحلية والجزئية للمتغيرات مختارة. من حيث الأهمية العالمية كل المتغيرات الإدخال 14 على قدم المساواة. تعرف على أفضل 10 عن طريق المساهمة العامة (عالمية) والتفاعل (أهمية محلية). وترد سبع أفضل المتغيرات في أهمية جزئية لكل فئة على الرسم البياني أدناه. تين. 2. أهمية جزئية من المتغيرات ل1 الطبقة الشكل. 3. أهمية جزئية من المتغيرات لفئة -1 وكما نرى، فإن المتغيرات الأكثر أهمية بالنسبة للفئات مختلفة تختلف من حيث الشكل والترتيب. وهكذا، إذا كان الصف -1 المتغير slowD هو الأكثر أهمية، ثم للفئة 1 أنها ليست سوى على مكان 4th. لذلك، لدينا مجموعات من البيانات جاهزة. الآن يمكننا المضي قدما في التجارب. 3. جزء التجريبية. وستجرى تجارب في الثورة لغة R R المفتوحة، الإصدار 3.2.2، وتوزيع الشركة الثورة تحليلات، على أن تكون محددة. revolutionanalytics / الثورة-R-فتح هذا التوزيع لديها عدد من المزايا على R العادية 3.2.2: حسابات سريعة وأكثر نوعية من خلال تطبيق المعالجة متعددة الخيوط مع إنتل الرياضيات نواة مكتبة الميزات المتقدمة قابل للإنتاج R الأدوات. واحد توضيح بسيط: اللغة R تتطور بنشاط من خلال التحسين المستمر للمجموعات الحالية وإضافة جديدة. الجانب الآخر من هذا التقدم ينطوي على فقدان التكاثر. وهذا هو، على منتجاتك التي كانت مكتوبة قبل بضعة أشهر، وكانت تعمل بشكل جيد، وفجأة توقف عن العمل بعد التحديث القادم من الحزم. يضيع الكثير من الوقت لتحديد وتصفية الخطأ الناجم عن التغير في واحدة من الحزم. على سبيل المثال، خبير مستشار تعلق على المادة الأولى على الشبكات العصبية العميقة كان يعمل بشكل جيد عند نقطة الخلق. ومع ذلك، بعد أشهر قليلة من نشر وشكا عدد من المستخدمين حول عدم قدرته على العمل والخمسين. وأظهر التحليل أن تحديث حزمة svSocket أدى إلى مستشار خبير الصورة خلل، وكنت غير قادر على العثور على السبب وراء ذلك. وسيلحق مستشار الخبراء وضع اللمسات الأخيرة على هذه المادة. وقد أصبحت هذه المشكلة قضية ملحة، وكان حلها بسهولة في الثورة تحليلات. الآن، عندما يتم تحرير التوزيع الجديد، يتم إصلاح حالة من كل مجموعة في repositary كرا في تاريخ الإفراج عن طريق نسخها على المرآة الخاصة بهم. لم تحدث تعديلات في الوديع كرا بعد هذا التاريخ يمكن أن تؤثر على حزم المجمدة على مرآة الثورة. وعلاوة على ذلك، بدءا من أكتوبر 2014، والشركة تبذل لقطات اليومية وديع كرا، وتحديد الدولة ذات الصلة والإصدارات من الحزم. مع حزمة تفتيش الخاصة بهم ونحن يمكن الآن تحميل حزم الضرورية ذات الصلة في تاريخ نحتاجه. وبعبارة أخرى، نحن نعمل على نوع من آلة الزمن. وآخر الأخبار. قبل تسعة أشهر، عندما اشترت مايكروسوفت تحليلات الثورة، وعدت لدعم مشاريعها وحافظت على الثورة R المفتوحة (RRO) توزيع متاح مجانا. تبع ذلك العديد من الرسائل حول المستجدات في RRO والثورة R Enterpise (ناهيك عن دمج R مع SQL Server. PowerBI. أزور وCortana Analitics). الآن لدينا معلومات أن التحديث RRO القادم سوف يطلق مايكروسوفت R المفتوحة. والثورة R المؤسسة مايكروسوفت R خادم. ومنذ وقت ليس ببعيد أعلنت شركة مايكروسوفت R التي R سوف تكون متاحة في Visual Studio. أدوات R ل Visual Studio (RTVS) يتبع أدوات بيثون لستوديو نموذج المرئي. سيكون حر، بالإضافة إلى Visual Studio من شأنها أن توفر بيئة تطوير متكاملة الكامل للبحث مع إمكانية تعديل وتصحيح البرامج النصية بشكل تفاعلي. بحلول الوقت الذي تم الانتهاء من المادة، ومايكروسوفت R المفتوحة (R 3.2.3) صدر بالفعل، وبالتالي، زيادة في المقالة سنشير إلى حزم لهذا الإصدار. 3.1. بناء نماذج 3.1.1. وصف موجز لحزمة DARCH والنسخة DARCH. تقدم 0.10.0 حزمة مجموعة واسعة من الوظائف التي دون ر مجرد السماح لإنشاء وتدريب نموذج، ولكن، حرفيا، وبناء عليه لبنة لبنة وتعديله وفقا لتفضيلاتك. كما ذكر سابقا، الشبكة العصبية العميقة تتكون من ن عدد من الإدارة القائمة على النتائج (ن طبقات -1) وMLP الشبكة العصبية مع عدد من الطبقات. يتم تنفيذ ما قبل التدريب طبقة الحكيمة الإدارة القائمة على النتائج على بيانات غير منسق بدون المشرف. يتم تنفيذ صقل الشبكة العصبية مع المشرف على تنسيق البيانات. تقسيم مراحل التدريب يعطينا فرصة لاستخدام البيانات المختلفة في الحجم (ولكن ليس بنية) أو للحصول على عدة نماذج مختلفة ضبطها غرامة على أساس ما قبل التدريب وحده. وعلاوة على ذلك، إذا كانت البيانات لمرحلة ما قبل التدريب وصقل هي نفسها، فمن الممكن لتدريب دفعة واحدة، بدلا من تقسيم في مرحلتين. أو يمكنك تخطي مرحلة ما قبل التدريب واستخدام الشبكة العصبية متعدد الطبقات فقط، أو، من ناحية أخرى، واستخدام الإدارة القائمة على النتائج فقط دون الشبكة العصبية. وفي الوقت نفسه لدينا إمكانية الوصول إلى جميع المعلمات الداخلية. المقصود حزمة للمستخدمين المتقدمين. وعلاوة على ذلك، سنقوم بتحليل العمليات مقسمة: مرحلة ما قبل التدريب وصقل. 3.1.2. بناء نموذج DBN. المعلمات. سنقوم بشرح عملية بناء وتدريب واختبار نموذج DBN. 1. نحن إنشاء كائن العمارة عميق اسمه DARCH باستخدام منشئ مع المعلمات الضرورية طبقات. مجموعة يشير إلى عدد من الطبقات والخلايا العصبية في كل طبقة. على سبيل المثال: طبقات ج (5،10،10،2) طبقة المدخلات مع 5 الخلايا العصبية (مرئية)، واثنين من طبقات خفية مع 10 الخلايا العصبية لكل منهما، وطبقة ناتج واحد مع 2 النواتج. حجم الدفعة . حجم عينة صغيرة أثناء التدريب. وما يليها. يشير إلى ما إذا شكل وما يليها يجب أن تستخدم لالأوزان، والانحرافات والمخارج. يتم تطبيق الشكل وما يليها لتوفير كميات كبيرة من البيانات مع الضغط. LogLevel. مستوى التسجيل والإخراج عند أداء هذه الوظيفة. GenWeightFunction. وظيفة لتوليد مصفوفة من الأوزان الإدارة القائمة على النتائج. هناك فرصة لاستخدام وظيفة تفعيل المستخدم الصورة. وDARCH-كائن تم إنشاؤه يحتوي على (طبقات - 1) الإدارة القائمة على النتائج مجتمعة في شبكة المتراكمة التي سيتم استخدامها لما قبل تدريب الشبكة العصبية. سمتان fineTuneFunction وexecuteFunction يحتوي على وظائف لصقل (العكسي افتراضيا) وتنفيذ (runDarch افتراضيا). تدريب الشبكة العصبية تتم مع اثنين من وظائف التدريب: preTrainDArch () وfineTuneDArch (). تدرب الوظيفة الأولى للشبكة الإدارة القائمة على النتائج دون المشرف باستخدام طريقة الاختلاف التقابلي. يستخدم الدالة الثانية على الوظيفة المشار إليها في سمة fineTuneFunction عن ضبط شبكة العصبية. بعد أداء الشبكة العصبية، والمخرجات من كل طبقة يمكن العثور عليها في executeOutputs السمة أو طبقة الانتاج الوحيدة في سمة executeOutput. 2. وظيفة ما قبل تدريب DARCH وجوه preTrainDArch (DARCH، بيانات، numEpoch 1، numCD 1. trainOutputLayer F)، DARCH. عينة من فئة DataSet DARCH. مجموعة البيانات لnumEpoch التدريب. عدد من التدريب العهود numCD. عدد مرات التكرار أخذ العينات. عادة، هو واحد يكفي. المعلمات الإضافية التي يمكن نقلها إلى وظيفة trainOutputLayer trainRBM. القيمة المنطقية التي تبين ما إذا كان ينبغي تدريب طبقة إخراج الإدارة القائمة على النتائج. وظيفة تؤدي وظيفة التدريب trainRBM () لكل الإدارة القائمة على النتائج، عن طريق نسخ بعد أوزان التدريب والتحيز إلى طبقات الشبكة العصبية ذات الصلة من وجوه DARCH. 3. وظيفة صقل للDARCH DARCH وجوه. عينة من فئة DataSet DARCH. مجموعة من البيانات للتدريب (يمكن استخدامها للتحقق من صحة) واختبار dataSetValid. مجموعة من البيانات المستخدمة لnumxEpoch التحقق من الصحة. عدد من التدريب العهود التمهيد. منطقيا، هل هو بحاجة إلى تطبيق التمهيد عند إنشاء التحقق من صحة البيانات isBin: يشير إلى ما إذا كان ينبغي تفسير بيانات الناتج كقيم منطقية. بواسطة FALSE الافتراضية. إذا كان هذا صحيحا، يتم تفسير كل قيمة فوق 0.5 ك 1، وأدناه كما 0. isClass. يشير إلى ما إذا يتم تدريب الشبكة للتصنيف. إذا كان هذا صحيحا، ثم سيتم تحديد إحصاءات عن التصنيفات. True بشكل افتراضي. stopErr. حدث معيارا لوقف تدريب الشبكة العصبية بسبب خطأ أثناء التدريب. - Inf التي كتبها stopClassErr الافتراضية. حدث معيارا لوقف تدريب الشبكة العصبية بسبب خطأ في التصنيف خلال التدريب. 101 من stopValidErr الافتراضية. معيار لوقف الشبكة العصبية بسبب خطأ في التحقق من صحة البيانات. - Inf التي كتبها stopValidClassErr الافتراضية. حدث معيارا لوقف الشبكة العصبية بسبب خطأ في التصنيف أثناء التحقق من الصحة. 101 افتراضيا. المعلمات الإضافية التي يمكن أن تنتقل إلى وظيفة التدريب. القطارات وظيفة الشبكة مع وظيفة المحفوظة في السمة fineTuneFunction من وجوه DARCH. (targetData، validTargets، testTargets) يمكن نقل البيانات المدخلة (trainData، validData، testData) والفئات التي تنتمي إليها بوصفها مجموعة البيانات أو وما يليها مصفوفة. البيانات والطبقات من أجل التحقق والاختبار ليست إلزامية. إذا توفر لهم، ثم سيتم تنفيذ الشبكة العصبية مع هذه المجموعات من البيانات، وسيتم احتساب الإحصاءات. السمة isBin تشير ما إذا كان ينبغي تفسير بيانات الناتج كما ثنائي. إذا isBin TRUE، يتم تفسير كل قيمة الانتاج فوق 0.5 ك 1، وإلا ك 0. أيضا، ونحن يمكن أن يحدد معيار التوقف عن التدريب على أساس الخطأ (stopErr، stopValidErr) أو التصنيف الصحيح (stopClassErr، stopValidClassErr) على التدريب أو التحقق من صحة مجموعات . جميع المعلمات وظيفة لها القيم الافتراضية. ومع ذلك، القيم الأخرى وتتوفر أيضا. لذلك، على سبيل المثال: وظيفة تفعيل الخلايا العصبية sigmoidUnitDerivative، linearUnitDerivative، softmaxUnitDerivative، tanSigmoidUnitDerivative المتاحة. يستخدم sigmoidUnitDerivative افتراضيا. وظائف للشبكة العصبية الصورة العكسي صقل افتراضيا، مرونة الإكثار rpropagation متاح في أربع صيغ (Rprop، Rprop-، iRprop، iRprop-) وminimizeClassifier (يتم تدريب هذه الوظيفة عن طريق المصنف شبكة DARCH باستخدام المترافقة غير الخطية أيضا طريقة التدرج). لخوارزميات الماضيين وبالنسبة لأولئك الذين لديهم معرفة عميقة للموضوع، وتقدم تطبيق منفصل للشبكة العصبية الصورة صقل مع تكوين المعلمات الخاصة بهم متعددة. على سبيل المثال: من المتوقع DARCH DARCH وجوه لإدخال البيانات التدريب trainData المحددة للتدريب targetData الانتاج لتدريب مجموعة أسلوب التدريب الأسلوب. iRprop افتراضيا. Rprop، Rprop-، iRprop - هي decFact ممكن تقليل عامل للتدريب. 0.5 من incFact الافتراضي - زيادة عامل للتدريب. 1.2 من weightDecay الافتراضي خفض الوزن في التدريب. 0 افتراضيا initDelta قيمة التهيئة في التحديث. 0.0125 افتراضيا minDelta الحد الأدنى الحدود لحجم الخطوة. 0.000001 افتراضيا maxDelta الحد العلوي لحجم الخطوة. 50 افتراضيا. وترجع وجوه DARCH مع الشبكة العصبية المدربين. 3.2. تشكيل نماذج التدريب والاختبار. لقد شكلت بالفعل العينة الأولية من البيانات. الآن، نحن بحاجة إلى تقسيمه إلى تدريب والتأكد من صحتها وفحص العينات. نسبة افتراضيا هي 2/3. حزم المختلفة لها العديد من الوظائف التي تستخدم لتقسيم العينات. يمكنني استخدام rminer :: المعقل () أن يحسب الأرقام القياسية لكسر العينة الأولية في التدريب واختبار العينات. ذ المطلوب متغير الهدف، ناقلات الرقمية أو عامل، في هذه الحالة، يتم تطبيق فصل طبقات (أي النسب بين الطبقات هي نفسها لجميع أجزاء) نسبة نسبة فصل (بالنسبة المئوية يتم تأسيس حجم العينة التدريب أو في internalsplit العدد الكلي للعينات تم تأسيس حجم عينة الاختبار) إذا تم فصل TRUE، البيانات ثم تدريب مرة أخرى إلى عينات للتدريب والتحقق. يتم تطبيق نفس النسبة لوضع العينات وضع الانفصال الداخلي. الخيارات المتاحة: الطبقية تقسيم عشوائي طبقية (إذا كان عامل تقسيم القياسية خلاف عشوائي) عشوائي معيار عشوائي أجل تقسيم وضع ثابت، عندما تستخدم الأمثلة الأولى للتدريب، وما تبقى منها للاختبار (تطبيق على نطاق واسع لسلسلة زمنية) المتداول المتداول نافذة أكثر المعروف باعتبارها نافذة انزلاق (يطبق على نطاق واسع في التنبؤ الأسهم والأسواق المالية)، وبالمثل النظام. باستثناء يشير هذا الإطار إلى حجم الإطار، التكرار المتداول المعبر للوعدد زيادة العينات الشرائح النافذة إلى الأمام في كل التكرار. يتم إصلاح حجم العينة التدريب لكل التكرار مع نافذة، في حين أن اختبار عينة ما يعادل نسبة، باستثناء التكرار الماضي (حيث يمكن أن يكون أقل). وضع تدريجي تدريجي من إعادة التدريب، والمعروف أيضا باسم نافذة زيادة، نفس النظام، إلا أن الإطار هو حجم الإطار الأولي، التكرارات الإضافية ايتر وعدد الزيادة من الأمثلة وأضاف في كل التكرار. حجم العينة تدريب ينمو (الزيادة) في كل التكرار، في حين أن حجم مجموعة اختبار ما يعادل نسبة، باستثناء التكرار الماضي، حيث يمكن أن تكون أصغر. عدد المعبر للالتكرارات من وضع تدريجي لإعادة التدريب (تستخدم فقط عندما وضع المتداول أو تدريجيا، وعادة ما يتم وضع المفاعل في حلقة). البذور إذا فارغة، ثم يتم استخدام البذور بشكل عشوائي، وإلا تم إصلاح البذور (مزيد من العمليات الحسابية سوف يكون دائما عادت نفس النتيجة) حجم نافذة نافذة التدريب (إذا وضع المتداول) أو الحجم الأولي من نافذة التدريب (إذا وضع الإضافية) عدد الزيادة من أمثلة أضاف إلى إطار التدريب في كل التكرار (إذا وضع تدريجية أو وضع المتداول). 3.2.1. فصول الموازنة وما قبل المعالجة. وسوف نكتب وظيفة من شأنها أن محاذاة (إذا لزم الأمر) عدد الطبقات في العينة نحو عدد أكبر، وتقسيم العينة إلى عينات التدريب والاختبار، وأداء ما قبل المعالجة (التطبيع، إذا لزم الأمر) ويعود القائمة مع عينات ذات الصلة تدريب والاختبار. لتحقيق التوازن، ونحن نذهب إلى استخدام الإقحام :: upSample () وظيفة التي تضيف عينات أخذت بشكل عشوائي مع استبدال، مما يجعل من توزيع الدرجة على قدم المساواة. يجب أن أقول أن ليس كل الباحثين تجد أنه من الضروري لتحقيق التوازن بين الطبقات. ولكن، كما هو معروف بالفعل والممارسة هي معيار الحقيقة، وتظهر نتائج تجاربي المتعددة التي عينات متوازنة تظهر دائما نتائج أفضل في مجال التدريب. على الرغم من أنه لا توجد الآن ر يوقفنا لتجربة لوحدنا. لمرحلة ما قبل المعالجة وسوف تستخدم الإقحام :: وظيفة المعالجة المسبقة ل(). سيتم حفظ المعلمات من تجهيزها في متغير prepr. وبما أننا قد نظرت بالفعل وطبقوها في مقالات سابقة، وأنا لن تقدم أي وصف آخر هنا. تعليق واحد حول ما قبل المعالجة: سيتم تطبيع متغيرات المدخلات إلى مجموعة من (-1، 1). 3.2.2. ترميز متغير الهدف عندما حل المهام تصنيف، المتغير الهدف هو عامل مع عدة مستويات (فصول). في نموذج يتم تعيين كناقل (العمود)، التي تتكون من الدول المستهدفة لاحقة. على سبيل المثال، ص (1، 1، 2، 3، 1). من أجل تدريب الشبكة العصبية، يجب ترميز متغير الهدف (تحول) في مصفوفة مع عدد من الأعمدة مساو لعدد من الطبقات. في كل صف من هذه المصفوفة، عمود واحد فقط قد يحتوي 1. هذا التحول جنبا إلى جنب مع استخدام وظيفة تفعيل softmax () في طبقة الإنتاج، ويتيح الحصول على الاحتمالات الدول المتغير الهدف المتوقع في كل فئة. وسوف تستخدم وظيفة classvec2classmat () لترميز. هذا في غير فقط أو أفضل طريقة لترميز متغير الهدف، ولكن سوف نستخدم ذلك لأنها بسيطة. ويتحقق التحول العكسي (فك) من القيم المتوقعة للمتغير الهدف من خلال الطرق المختلفة التي نحن ذاهبون لتغطية قريبا. 3.3. تدريب نموذج 3.3.1. التدريب قبل وكما ذكر أعلاه، لأول مرة، ونحن خلق الكائن العمارة عميق اسمه DARCH. يتضمن العدد المطلوب من الإدارة القائمة على النتائج مع معايير التدريب الأولي افتراضيا، والشبكة العصبية بدأت مع الأوزان العشوائية وظيفة تنشيط الخلايا العصبية التي وضعتها الافتراضية. في مرحلة إنشاء كائن، والمعلمات قبل التدريب يمكن أن تتغير، إذا لزم الأمر. بعد ذلك، وشبكة الإدارة القائمة على النتائج سيتم قبل تدريب دون المشرف بإرسال عينة التدريب (بدون متغير الهدف) إلى الإخراج. بعد الانتهاء منه، وحصلنا على RCH D حيث يتم نقل الأوزان والانحيازات التي تم الحصول عليها خلال التدريب الإدارة القائمة على النتائج إلى الشبكة العصبية. ينبغي لنا أن نضع مقدما توزيع الخلايا العصبية مخبأة في طبقات في شكل ناقلات (على سبيل المثال): عدد الخلايا العصبية في طبقة الإدخال يساوي عدد المتغيرات الإدخال. سيحتوي طبقتين الخفية 50 الخلايا العصبية بعضها، فإن طبقة الإنتاج واثنين. اسمحوا لي أن أشرح شيئا آخر. إذا متغير الهدف (عامل) واثنين من المستويات (الطبقات)، ثم، في الواقع، ناتج واحد يكفي. لكن تحويل ناقلات في مصفوفة مع عمودين، كل منهم المقابلة لفئة واحدة، ويسمح لنا لتطبيق وظيفة التنشيط softmax، التي تعمل بشكل جيد في المهام تصنيف، في طبقة الإنتاج. وعلاوة على ذلك، والمخرجات في شكل الاحتمالات الطبقة تعطينا فرصا إضافية في تحليلها لاحقا من النتائج. وسيتم تغطية هذا الموضوع قريبا. عدد العهود عندما يتم تعيين التدريب تجريبيا، عادة ضمن مجموعة من 10-50. وعدد من تكرار أخذ العينات يبقى افتراضيا، ولكن هذه المعلمة ويمكن زيادة إذا كنت ترغب في تجربة. سيتم تحديده في وظيفة منفصلة: 3.3.2. صقل وكما ذكرنا سابقا، فإن حزمة تقدم العكسي ()، rpropagation ()، minimizeClassifier ()، minimizeAutoencoder () لصقل. الماضيين فاز ر النظر فيها، لأنها ليست موثقة بما فيه الكفاية في حزمة، وليس هناك أي أمثلة على كيفية تطبيقها. ديدن هذه الوظائف في تجاربي ر إظهار نتائج جيدة. وأود أيضا أن أضيف شيئا عن تحديثات الحزمة. عندما بدأت كتابة هذا المقال، كان الإصدار الحالي 0.9، واللحظة التي تم الانتهاء منه، تم إصدار جديد 0.10 النسخة تحتوي على عدة تغييرات. كان لا بد من إعادة بنائه كل الحسابات. وبناء على نتائج اختبارات قصيرة، ويمكنني أن أقول أن سرعة العملية قد تزايد بشكل كبير، على عكس جودة النتائج (التي هي أكثر خطأ من المستخدم، ثم الحزمة). السماح ليالي النظر في وظيفتين الأولى. تم تعيين أول (العكسي) بشكل افتراضي في كائن RCH D ويستخدم المعلمات شبكة التدريب العصبية المقدمة هنا. والوظيفة الثانية (rpropagation) له أيضا المعلمات الافتراضية وأربعة أساليب التدريب (المذكورة أعلاه) التي iRprop افتراضيا. من المؤكد أننا نستطيع تغيير كل المعلمات وطريقة التدريب. فمن السهل أن تطبق هذه الوظائف: تغيير وظيفة صقل في FineTuneDarch () بالإضافة إلى صقل الإعدادات، يجب علينا أن مجموعة (إذا لزم الأمر) وظيفة تفعيل الخلايا العصبية في كل طبقة. ونحن نعلم أن يتم تعيين sigmoidUnit في جميع طبقات افتراضيا. كان متوفرا في حزمة sigmoidUnitDerivative، linearUnitDerivative، tanSigmoidUnitDerivative، softmaxUnitDerivative. وصقل فيل تكون محددة مع وظيفة منفصلة مع القدرة على اختيار وظيفة صقل. سنقوم بجمع الوظائف المحتملة من التنشيط في قائمة منفصلة: سنكتب وظيفة صقل التي من شأنها تدريب وتوليد شبكتي العصبية: تدريب لأول مرة باستخدام وظيفة العكسي، والثانية مع rpropagation: بعض التوضيحات حول معلمات رسمية من وظيفة. البديل - اختيار وظيفة صقل (1- 2- العكسي rpropagation). dbnin - نموذج استلام نتج عن مرحلة ما قبل التدريب. س - مجموعة البيانات لصقل (بيانات). HD - معامل أخذ العينات (hiddenDropout) في طبقات مخفية من الشبكة العصبية. معرف - معامل أخذ العينات (inputDropout) في طبقة المدخلات من الشبكة العصبية. عمل - ناقلات مع الإشارة إلى وظيفة تنشيط الخلايا العصبية في كل طبقة من الشبكة العصبية. طول الموجه وحدة واحدة أقصر من عدد من الطبقات. NE - عدد من العهود التدريب. بيانات جوهر الجديدة التي ظهرت في هذا الإصدار. أنا لا أفهم حقا السبب وراء ظهورها. عادة، ولغة لها طريقتان لنقل المتغيرات إلى نموذج باستخدام زوج (س، ص) أو صيغة (بيانات ذ). ظهور هذا الجوهر لا توجد الآن ر تحسين الجودة، ولكن يخلط بين المستخدمين بدلا من ذلك. ومع ذلك، قد يكون مؤلف أسبابه غير معروفة بالنسبة لي. 3.4. اختبار النموذج. etrics. اختبار نموذج تدريب يتم تنفيذها على عينات الاختبار. يجب أن يؤخذ في الاعتبار أن وسوف نقوم بحساب مقياسين: دقة الرسمية والنوعي ك سيتم توفير المعلومات ذات الصلة أدناه. لهذا الغرض، ونحن في حاجة الى سنتين عينات مختلفة من البيانات، وسأشرح لك لماذا. لحساب دقة نحتاج قيم متغير الهدف، ومتعرجة، ونحن نتذكر من قبل، في أغلب الأحيان ليست محددة على القضبان الماضية. ولذلك، فإن عينة اختبار لحساب الدقة سوف نحدد مع وظيفة prepareTrain ()، والمؤشرات النوعية سوف نستخدم الدالة التالية وسيتم اختبار هذه النماذج على 500 الحانات الأخيرة من التاريخ. للاختبار الفعلي، testAcc () وtestBal () سيتم تطبيقها. الوظيفة الأولى ترجع لجنة التنسيق الإدارية وهدف قيم المتغيرات (الحقيقية أو توقع) لمزيد من التحليل ممكن. والوظيفة الثانية ترجع إشارات تنبأ لEA سيج، والتوازن التي تم الحصول عليها استنادا الى تلك الاشارات (بال)، ومعامل الجودة (). الحد الأقصى لقيمة هذا المعامل على المنطقة اختبار (Kmax) والحد الأقصى للسحب (اليوم) في نفس المنطقة. عند حساب التوازن، من المهم أن نتذكر أن إشارة توقع مشاركة يشير إلى شريط المستقبل أن هاسن تي تشكلت بعد، وبالتالي، فإنه ينبغي حذفها في العمليات الحسابية. لقد فعلت ذلك عن طريق تحريك ناقلات سيج بواسطة شريط واحد إلى اليمين. 3.4.1. توقعات فك. النتيجة التي حصل عليها يمكن فك (تحويلها من مصفوفة لناقلات) باستخدام طريقة اعبات التنس المحترفات. الطبقة يساوي عدد الأعمدة مع الحد الأقصى لقيمة احتمال، وعتبة قيمة هذا الاحتمال يمكن تعيين أدناه والتي لم يتم تحديد الطبقة. إذا تم تعيين عتبة 0.5، وأكبر احتمال في الأعمدة أقل من هذا الحد، سيتم الحصول على الدرجة إضافية (غير محددة). وينبغي أن تؤخذ في الاعتبار عند حساب مقاييس مثل دقة. 3.4.2. تحسين نتائج التنبؤ هل من الممكن لتحسين نتيجة التنبؤ بعد تلقيه هناك ثلاث طرق محتملة يمكن تطبيقها. معايرة معايرة عيسى حساب النطاقات إمكانية أن تعطي التوافق أدق مع البيانات الحقيقية. لهذا الغرض، وهناك وظيفة خاصة في حزمة CORElearn: ناقل correctClass مع العلامات الصحيحة من فئات لتصنيف المشكلة ناقلات predictedProb مع (احتمال) فئة تنبأ 1 من نفس طول طريقة correctClass واحدة من ما يلي (isoReg، binIsoReg ، binning، mdlMerge). لمزيد من المعلومات يرجى قراءة ناقلات وصف حزمة الوزن (إذا أشار) يجب أن يكون نفس طول correctClass، وتوفير الأوزان لكل ملاحظة، وإلا الأوزان كافة الملاحظات تساوي 1 من noBins الافتراضي قيمة المعلمة تعتمد على طريقة ويحدد المطلوب أو الأولية ه. ك . 3.4.3. 4.2. لا يفوتون تحديث الاشتراك في R-المدونين لتلقي رسائل البريد الإلكتروني مع كل المشاركات البحث. (لن ترى هذه الرسالة مرة أخرى.)

Comments

Popular posts from this blog

أفضل 5 لمؤشرات التداول

Foreks أبل

تجارة الفوركس بنك دوكاسكوبي