chingizid
10
All posts from chingizid
  chingizid in chingizid,

Data mining и(или) МИНОА.Кто владеет и кто ввел в сою практику-поделитесь!?

Преамбула...

Каждый из нас сталкивается с необходимостью "лопатить" большие массивы инфы.Это характерно аналитикам(для ежедневной работы),и постоянно совершенствующим трейдерам(для получения материала для учебы). 

Определение... 

Data mining- интеллектуальный анализ данных. Процесс обнаружения в неструктурированных данных неизвестных, нетривиальных, практически полезных и доступных для интерпретации знаний.
МИНОА (мнемотехническое сокращение по первым буквам) - методы изыскания, накопления, обработки и анализа информации.

Суть метода...(описание от автора)

Этап 1. Сбор информации."Я расскажу об основных современных источниках информации (уверяю вас: существуют гораздо более эффективные места, чем «Яндекс»!), опишу глобальный алгоритм data mining, перечислю компьютерные программы, которые понадобятся нам для полноценной работы, приведу примеры креативных затруднений,возникающих именно на этапе информационного сбора."
Этап 2. Мы внимательно изучим главные источники информации. Я расскажу о принципах работы с открытыми поисковыми системами, форумами и новостными конференциями Usenet, порталами периодической печати, «Википедией»,блогами и закрытыми (подписными) поисковыми системами (TimesSelect,Highbeam и др.).
Этап 3. Google — мощнейший инструмент информационного дознания, который подавляющее большинство людей использует от силы на 5%. Мы познакомимся с основами поискового языка (фраза, булеан, выраженное включение, синонимы,цифровые ряды, использование групповых символов, поиск в диапазоне слов),изучим продвинутый синтаксис (операторы intitle:, intext:, inanchor:, site:, inurl:,link:, cache:, daterange:, filetype:, related:,info:, phonebook:, daterange), поисковую надстройку Soople, комбинаторный анализ ключевых слов (техника Search Grid),технику смешения синтаксиса, рассмотрим структуру результатов поиска и научимся их анализировать, научимся применять программу визуализации результатов TouchGraph Google Browser, разберемся с директориями Google и спецификой поиска изображений.
Этап 4. Чрезвычайно полезный источник информации IRC (Internet Relay Chat), о котором все слышали, но практически никто не умеет пользоваться. Мы изучим несколько программ-клиентов IRC,познакомимся с протоколом DCC (Direct Client Connection) и его синтаксисом и на практических примерах удостоверимся в эффективности работы этого источника информации.
Этап 5. Накопление информации — следующая стадия МИНОА. Мы изучим самые удобные базы данных, предназначенные для хранения разнообразных исходных материалов: текстов, графиков, таблиц, изображений и мультимедийного контента. Сформулируем понятие индивидуального информационного архива и займемся его формированием и наполнением. Научимся пользоваться программами-посредниками между информационным сырьем и базами данных, разнообразие которых варьируется от простых плагинов для браузера до изысканнейших stand-alone автоматизированных коллекторов.
Этап 6. Форматы — подводный камень,в самый неожиданный и неподходящий момент нарушающий плавное течение data mining. Мы рассмотрим самые популярные форматы: PDF, CHM, DOC, FB2,EPUB — в плане их мобильного пользования (на платформах iOS, Windows Mobile  и Android) и удобства индексирования в базе данных. 
Этап 7. Обработка информации — третья стадия МИНОА. Познакомимся с понятием реляционной индексируемой базы данных, научимся наполнять информацией лучшие ПИМы (персональные информационные менеджеры) для Windows и Mac OS X — программы «Архивариус 3000», Evernote и EagleFiler.
Этап 8. Анализ информации — связующее звено между компилятивным и эвристическим этапами data mining.Мы изучим поисковый синтаксис популярных ПИМов, предложим на выбор несколько а льтернат ивны х баз данных, обсудим преимущества и недостатки встроенных в ОС поисковых систем (Search в Windows и Spotlight в Mac OS X).
Этап 9. Креатив. Мы определим критерии качественного усвоения информации, установим баланс между эвристическим началом и компиляцией, четко оговорим критерии плагиата. Я познакомлю читателей с современной техникой творческого осмысления материалов (визуализацией процессов мышления) и ее основным инструментом — интеллект-картами (Mind Maps).
После обзора теории Тони Бьюзена и изучения основных принципов эффективной визуализации рассмотрим две лучшие кросс-платформенные программы для составления интеллект-карт —  MindManager и MindMap. Рассмотрим типы интеллект-карт и определим сферы и специфику их применения в конкретных ситуациях. Интеллект-карты, на мой взгляд, являются не только самым эффективным,но и эффектным аспектом МИНОА.
Этап 10. Глобальный алгоритм. В заключительной части нашего курса мы научимся задействовать уже знакомые нам информационные техники и компьютерные программы на креативном уровне. Проведем пошаговый анализ этапов создания авторского контента с учетом специфики тех или иных задач, поставленных в области.

Интересно знать мнения тех трейдеров и аналитиков,которые владеют и ввели эту(и) технику(и) в свою повседневную работу!!!