أنا باستخدام مرشح المتوسط المتحرك لتسهيل البيانات لإزالة أوتلير عن طريق تغيير عدد متوسط النقاط، وأنا الحصول على نتيجة مختلفة. البيانات بلدي هي متجهات ميزة متعددة الأبعاد. أطبق المتوسط المتحرك للمصفوفة بأكملها ثم على المتغيرات الفردية . أنها تعطي نتائج مختلفة. لذلك، كيفية اختيار تخمين عدد من النقاط إلى المتوسط أكثر وينبغي أن تطبق على مصفوفة بأكملها أو على أساس واحد تلو الآخر. حسنت 1 نوفمبر في 21 44.Glenb 163k 20 274 557. وأحد النهج لاختيار معلمة تمهيد هو تحسين أخطاء التنبؤ خطوة واحدة إلى الأمام مثل كميات من مربعات أخطاء التنبؤ خطوة واحدة إلى الأمام إذا حاولت تحديد القيم المتطرفة، كنت تريد مقياسا مختلفا لخطأ التنبؤ - واحد قوية نسبيا إلى القيم المتطرفة ومن ثم تتحرك المتوسطات يبدو خيارا غريبا - لماذا لا شيء أكثر قوة إلى القيم المتطرفة جلينب نوفمبر 2 13 في 1 11.Neither كل all. Sorry ولكن أعتقد أن هذا هو محاولة أخرى وإن كانت ذكية واحدة لأتمتة ما يمكن ر حقا أن يكون أوت حذفت بطبيعة الحال أساليب مختلفة تعطي نتائج مختلفة في الأوقات الوحيدة التي سوف t هو حيث أن أوتلير هو واضح بحيث أنك لا تحتاج إلى اختبار. اقترحي هو استخدام مجموعة متنوعة من الطرق لتحديد القيم المتطرفة المحتملة، ثم فحص تلك القيم المتطرفة على الفرد أساس أنا أعمل مع كمية كبيرة من سلسلة زمنية هذه السلسلة الزمنية هي في الأساس قياسات الشبكة القادمة كل 10 دقيقة، وبعضها الدوري أي عرض النطاق الترددي، في حين أن بعض أرين أخرى التعادل كمية من حركة المرور التوجيه. أود بسيطة خوارزمية للقيام الكشف خارج الإنترنت في الأساس، أريد أن تبقي في الذاكرة أو على القرص البيانات التاريخية كلها عن كل سلسلة زمنية، وأريد أن كشف أي أوتلير في سيناريو الحية في كل مرة يتم التقاط عينة جديدة ما هي أفضل طريقة لتحقيق هذه النتائج. أنا حاليا باستخدام المتوسط المتحرك من أجل إزالة بعض الضوضاء، ولكن بعد ذلك ما بعد الأشياء البسيطة مثل الانحراف المعياري، جنون ضد مجموعة البيانات كلها لا تعمل بشكل جيد أستطيع أن افترض e سلسلة زمنية ثابتة، وأريد شيئا أكثر دقة، ومن الناحية المثالية مربع أسود مثل. من ناقلات هو مجموعة من مزدوجة تحتوي على البيانات التاريخية، وقيمة العودة هي النتيجة الشذوذ لقيمة عينة جديدة. أحسن أوغ 2 10 في 18 03.I أقترح المخطط أدناه، والتي ينبغي أن تكون قابلة للتطبيق في يوم أو نحو ذلك. جمع عينات كثيرة كما يمكنك الاحتفاظ بها في الذاكرة. إزالة القيم المتطرفة واضحة باستخدام الانحراف المعياري لكل سمة. حساب وتخزين مصفوفة الارتباط وأيضا ومتوسط كل سمة. حساب وتخزين مسافات ماهالانوبيس من كل ما تبذلونه من العينات. حساب أوتليرنيس. لعينة واحدة التي تريد أن تعرف outlierness. Retrieve الوسائل، مصفوفة التباين و ماهالانوبيس المسافة s من التدريب. حساب المسافة ماهالانوبيس د لعينتك. إعادة المئين الذي د يسقط باستخدام مسافات مهالانوبيس من training. That يكون النتيجة أوتلير الخاص بك 100 هو outlier. PS المتطرفة في حساب مهالانوبيس ديستا نيس استخدام مصفوفة الارتباط، وليس مصفوفة التباين هذا هو أكثر قوة إذا كانت قياسات العينة تختلف في وحدة ورقم. كشف التلقائي أوتلير نعمة أو لعنة. واحد من الأسئلة المحيرة التي يطلبها المخططون الطلب في ورش العمل التدريبية لدينا هو السبب في برامجها تنتج توقعات مسطحة 90 من الوقت برنامج مكلفة التي أخذت الجيش وبضع سنوات لتنفيذ عادة اقترح نموذج ثابت أو نموذج متحرك أدى هذا إلى توقعات مسطحة. على الرغم من أن بالعين المجردة يمكن أن نرى بيانيا إذا كانت الرسوم البيانية متاحة لل المستخدم نمط موسمية لطيفة، واختيار الخبراء في البرنامج أنتجت التنبؤ المستمر إلى الخلود هناك العديد من الحيل الكامنة وراء هذه النتيجة النهائية بعض منهم معروف وبعض منهم مخفي. واحد من الجناة هو عملية الكشف عن خارج يمكن للبرنامج كشف بذكاء القيم المتطرفة لإعداد معين وطريقة الكشف خارج النطاق عادة ما تستخدم عامل K لتطوير نطاقات التسامح حول عامل ما بعد آخر إلى تحديد القيم المتطرفة ما هي العوامل K وكيفية الاستفادة من إعدادات K - عامل لإنتاج نماذج جيدة للتنبؤ. لاحظنا في مجموعة متنوعة من الحالات، والناس استخدام منخفضة K العوامل التي ثم التخلص من جميع القمم الموسمية وأحواض A انخفاض عامل k هو يقظة فائقة أنها لا تسمح أي نمط للهروب من خلال لمحرك النمذجة كل محرك يرى هو مجرد مجموعة من بضع نقاط البيانات التي هي متناثرة عن كثب حول التوقعات السابقة أو مجرد وسيلة تاريخية. انظر الصورة أدناه. عامل k من 1 سوف القضاء على جميع الأنماط التي ينظر إليها في ملف الطلب انها مجرد تبقي جزء صغير من مجموعة البيانات الأصلية التي تشير جميعها إلى المتوسط التاريخي باعتباره توقعات دقيقة عنيفة وهذا لا علاقة له مع قوة المحرك الإحصائي المتاحة إلى البرنامج. في ما يصل لدينا القادمة ورشة عمل لمدة ثلاثة أيام وسوف نناقش مخاطر الكشف التلقائي أوتولير ويكون الحضور العمل من خلال التدريب العملي على ممارسة من شأنها أن تعطي رؤية أفضل لعملية الكشف عن خارج كامل نحن فيل ل شرح الميزات تحت غطاء محرك السيارة من ساب أبو وحدة تخطيط الطلب للتنقل من خلال هذه العملية المحفوفة بالمخاطر. يوم 3 سيكون كل ساب أبو مع التدريب العملي على التدريب على منصة البرنامج وكان الحضور في سبتمبر 2011 ورشة عمل قادرة على جعل مباشرة نموذج والمعلمة تغييرات على توقعاتهم الحية في ورشة العمل. زيارة لمزيد من التفاصيل حول ورشة العمل يرجى التواصل معي إذا كان لديك المزيد من الأسئلة أو ترغب في مناقشة عملية الكشف عن أبلي في أبو موانئ دبي.
Comments
Post a Comment