Sunday 21 January 2018

استراتيجيات التداول لاستغلال المدونة و الأخبار المعنويات


منشورات مماثلة استراتيجيات التداول لاستغلال المدونة والأخبار المعنويات ون بين تشانغ وستيفن Skiena قسم علوم الحاسب، جامعة ستوني بروك ستوني بروك، NY 11794-4400 USA نحن نستخدم وسائل الاعلام الكمي (بلوق، والأخبار وعلى سبيل المقارنة) البيانات التي تم إنشاؤها بواسطة معالجة اللغة الطبيعية على نطاق واسع (NLP) نظام تحليل النص لأداء شامل و دراسة مقارنة حول كيفية ذكرت الشركة الإعلام تواترا quency، قطبية المشاعر والذاتية يتوقع أو إعادة flects أحجام تداول الأسهم والعوائد المالية. لنا يقدم تحليلا دليل ملموس على أن بيانات وسائل الاعلام هو غاية غنية بالمعلومات، كما اقترح سابقا في الأدب - ولكن لم تدرس على نطاق لدينا العديد من مجموعات كبيرة من بلوق والأخبار لأكثر من خمس سنوات. بناء على النتائج التي توصلنا إليها، ونحن تعطي استراتيجية تداول سوق محايدة على أساس المشاعر التي يعطي عوائد إيجابية باستمرار مع تقلب منخفض فوق لمدة خمس سنوات (2005-2009). نتائجنا كبيرة في مؤكدا أداء بلوق العامة والأخبار الحسية طرق التحليل timent أكثر من المجالات ومصادر واسعة. وعلاوة على ذلك، العديد من الاختلافات الملحوظة بين الأخبار و يتم تحديد بلوق أيضا في هذه الورقة. مقدمة تؤكد فرضية كفاءة السوق أن األسواق المالية كيتس هي "كفاءة إعلاميا"، وهو ما يعني الحالي أسعار الأسهم تعكس بالفعل جميع المعلومات المعروفة وكل وقعت الحقائق. وعلاوة على ذلك، والأسعار في الأسواق المالية هي غير الممثلة منحاز وتحتوي على كل حكمة أو التنبؤات المستقبلية من المستثمرين. ولذلك، يمكن للمستثمرين لا تجعل prof - الزائدة من السوق إذا تستند استراتيجيات التداول على المعلومات المعروفة، وذلك لأن أسعار السوق بكفاءة جمع وتجميع المعلومات المختلفة والحفاظ على تغيير دون تأخير. ومع ذلك، فإن وثائق الأدب كبيرة ومتزايدة على أن تحركات المؤشرات المالية ليست دائما يتسق خيمة مع مقاييس كمية من fundamen - شركات ' tals (على سبيل المثال (كاتلر، Poterba، وسومرز 1989؛ لفة 1988؛ ج. 2010، جمعية نهوض الاصطناعي الاستخبارات (AAAI). جميع الحقوق محفوظة. يمكن أن توفر وسيلة ممكنة ومفيدة لتحليل المالي هدفنا الأساسي هو دراسة العلاقة بين بيانات البورصة والبيانات الإعلامية اللغوية، سواء بلوق و أخبار، andtoillustratetheextenttowhichtheycancontribute لتصميم استراتيجيات الاستثمار. لدينا إسهامات الرئيسية ستعقد في هذه الورقة هي: • دراسة مقارنة للمدونات والأخبار - نحن إجراء دراسة مقارنة مدروس من أربعة linguis - مختلفة مصادر التشنج، أي تويتر، Spinn3r RSS بلوق، LiveJour - بلوق نال، والصحف اليومية الأخبار وعلى سبيل المقارنة. نحن احمللية حلج مشاعرهم مع الأسهم المقابلة وeval - uate أداء التداول بالأسهم مع استخدام أربعة مصادر التوالي. يكتشف تحليلنا أيضا العديد من خصائص متميزة بين بلوق والأخبار. على سبيل المثال، يمكن دمج المعلومات الأخبار في أسعار الأسهم على الفور (تقريبا في حدود 1 يوم) بعد الإفراج عنهم، في حين بلوق وسيتم استيعاب المعلومات مثل التغريد من قبل سوق الأوراق المالية مع فترة زمنية أطول (حوالي 2-3 أيام). • تحليل واسع النطاق - نحن تعطي نتائج شاملة ل تحليل سوق الأسهم باستخدام ما يقرب من واحد تيرابايت من بلوق والبيانات الأخبار والآلاف من شركات مختلفة. هذه مقياس التحليل لم يعهده من قبل في theliterature، andenablesustoidentifyshort-termbutsta - tistically ارتباط كبير بين حجم وسائل الاعلام / المشاعر والعوائد / أحجام التداول المالية. • كوربوس حجم المسائل - العمل السابق على المشاعر التي تستند إلى التحليل المالي (على سبيل المثال (Tetlock، سار-Tsechansky، و Macskassy 2007)) يركز بشكل واضح على وطنية المالية الصحف، وهي خدمة أخبار داو جونز و WallStreetJournal. ومع ذلك، wedemonstratethatamore كبيرة وموثوق بها إشارة المشاعر تأتي من analyz - • التحقق من ثقة تحليل طرق - ربما الأنبار مساهمة هامة أخرى من الورق لدينا هو الأقوى التحقق حتى الآن من دقة الشعور وسائل الإعلام لدينا منهجية تحليل ليديا. التحقق من صحة الصحيح هو المناعي ممكن في غياب أي المتفق عليها معيار الذهب لتحليل المشاعر على مستوى الكيان (بانغ ولي 2008). ولكن قدرتنا على انتزاع المشاعر موثوقة بما فيه الكفاية إشارة لتداول بنجاح على (بغض النظر عن توقيت القرار) يقدم دليلا دقيقا هذا الشعور لدينا طرق تعكس بدقة تغييرات حقيقية في استجابة لlin - معلومات guistic. ويتم تنظيم هذه الورقة على النحو التالي. أولا نستعرض إعادة العمل ذا الصلة. نحن بعد ذلك وصف المنشأ وخصائص البيانات الإعلامية والمالية التي نعمل معها. بعد ذلك، ونحن إعطاء تحليل كامل للعلاقة بين كبرى متغيرات سوق الأوراق المالية والمتغيرات وسائل الإعلام الرئيسية، والتي هي أهم جزء من هذه الورقة. وأخيرا، فإننا نقترح وتقييم استراتيجية تداول سوق محايدة على أساس me - البيانات ديا. نستنتج أن أسعار المالية بشكل ملحوظ المترابطة مع البيانات الكمية وسائل الإعلام يمكن استخدامها ل صياغة استراتيجيات التداول مثيرة للاهتمام. الأعمال ذات الصلة وينقسم العمل السابق بين التمويل والكمبيوتر الأوساط الأكاديمية العلمية. نحن بحوث المسح الأول من عالم المالي. Tetlock (Tetlock، سار-Tsechansky، وMacskassy 2007) تحقق ما إذا كان وقوع الكلمات السلبية في يمكن أن شركة معينة المقالات الإخبارية يساعدنا على التنبؤ النقدية شركات ' تدفقات وإذا كانت أسعار سوق الأسهم شركات "تتضمن المعلومات اللغوية بكفاءة. يزعمون أن الشركات " أسعار الأسهم تحت لرد على املعلومات السلبية الكامنة نشوئها من المقالات الإخبارية. وبشكل أكثر تحديدا، املعلومات سلبية تنعكس نشوئها في المقالات الإخبارية في أسعار سوق الأسهم مع تقريبا تأخير ليوم واحد. شان (شان 2003) يدرس عوائد شهرية لمجموعة فرعية الأسهم بعد إصدارها الأخبار العامة عنهم ويجد أن المستثمرين تتفاعل ببطء على المعلومات، خاصة بعد اخبار سيئة. اكتشاف مهم آخر هو أن الأسهم تميل إلى عكس في الشهر اللاحق بعد سعر المدقع الحرآة الإدلاء بالبيانات غير المصحوبين الاخبارية للانباء العام. وبالإضافة إلى ذلك، فإن هذه أنماط ذات دلالة إحصائية. واحد الحد من هذا تستخدم الدراسة الخشنة، تحبب الشهري. في ورقة لدينا، تقديم تحليل الأخبار وسعر الحركات اليومية. دراسة Antweiler وفرانك (Antweiler وفرانك 2004) أكثر من 1.5 مليون رسالة من ياهو! المالية و الثور الهائج، وهما الأكثر شعبية اسهم الإنترنت لوحات الرسائل. انهم يعملون ساذج بايز والدعم المصنفات آلة ناقلات لتقييم "الصاعد" مضمون هذه الرسائل الأسهم. أنها تظهر هذه المجالس هي رسالة مفيدة جدا، وكذلك أن الاتجاه الصعودي هو إيجابي ويرتبط بشكل كبير مع عوائد. من حيث التداول حجم، تبين الورقة آراء مثيرة للجدل وassoci - ATED مع مزيد من الصفقات. من الجانب علوم الحاسب وبحوث مكثفة ل ألقاها مجتمعات التعدين النص أو تعلم الآلة. الفكرة الأساسية هي تحديد المعلومات اللغوية مع تقنيات تحليل النصوص، والحصول على مجموعة محددة مسبقا من ملامح البيانات التدريب، ومن ثم بناء نماذج مختلفة مع classi - النهج الإحصائية كال أو خوارزميات التعلم الإحصائية. مسح مفصل للتعدين النص للاستجابة السوق إلى الأخبار يمكن العثور عليها في (Mittermayer وKnolmayer 2006a). على وجه الخصوص، يتم استخدام نموذج 3-فئة على نطاق واسع لتسمية الوثائق أو الكلمات. الفئة الأولى (إيجابية المشاعر) ويتكون من المقالات الإخبارية أو الكلمات التي تجعل زيادة المرتبطة المتغيرات المالية إلى درجة معينة في فترة زمنية معينة، على سبيل المثال، حدث أنباء يجعل سعر السهم واحد "IBM" زيادة 0.5٪ في بتقليد اليوم خوار. وبالمثل، فإن الفئة الثانية (الحسية السلبية timent) يعرف وفقا لذلك. وتتكون الفئة الثالثة من المقالات الإخبارية المحايدة أو الكلمات. يوصف بموجب هذا النموذج يتضمن (فونغ، يو، ولام 2002؛ Mittermayer وKnolmayer 2006b؛ توماس 2003؛ Wuthrich، تشو، وغيرها. 1998). وكان هناك أيضا اهتمام كبير في الرأي التعدين والمجتمع البرمجة اللغوية العصبية على استخدام تيارات النص المالية نحن هنا تصف مصادر بيانات المخزون وسائل الإعلام وهو الأساس لتحليلنا في هذه الورقة. بيانات المخزون يتم الحصول على لدينا سعر السهم والبيانات حجم من Thom - بيانات وسائل الاعلام ولدت ذات الصلة شركة بلوق والأخبار البيانات بنا، جي ليديا ((لويد، Kechagias، وSkiena 2005)، textmap)، عالية السرعة تجهيز النصوص الصنعي

No comments:

Post a Comment