Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Рабочий режим

Постановка задачи | Задача классификации | Стратегия One-vs.-rest | Multi-label классификация | Методы и алгоритмы, реализованные в программной системе | Наивный Байесовский Классификатор | Стохастический Градиентный Спуск | Предобработка информации | Инструкция пользователя | Рабочий режим |


Читайте также:
  1. Assert срабатывает только в режиме Debug
  2. FQP в режиме маски
  3. My working day - Мой рабочий день
  4. NB! Питьевой режим: 2 литра жидкости в сутки (см. список разрешенных напитков).
  5. Rights of foreign citizens and persons without citizenship in the Russian Federation. [Электронный ресурс]. – Режим доступа: http://www. PetersburgCity.com/safety guide.
  6. Sanno F1, Батарея 2680mAh 20-30 дней в режиме ожидания
  7. Авторежим пневматический 100.050-1М

Необходимо скопировать файл с программой FactGeneralizer.py в любую папку на пользовательском компьютере. Также необходимо скопировать нужные для работы файлы в любую папку на пользовательском компьютере. В случае работы программы в рабочем режиме необходимы два файла. Первый из них, содержащий пары «событие – изменение в тренде» будет использован для обучения классификатора. Второй должен содержать записи об изменениях в трендах, которые система попытается объяснить. Далее необходимо открыть командную строку и с помощью команды cd перейти в папку, в которой хранится файл FactGeneralizer.py. Для запуска программы в тестовом режиме необходимо ввести в командной строке следующую команду и нажать Enter:

python FactGeneralizer.py “work” “PriceFacts.csv” “ToPredict.csv” “Results.csv” “linear”

Значение параметров приведено ниже:

1) “test” – метка, обозначающая что программа будет работать в тестовом режиме

2) “PriceFacts.csv” - имя файла, содержащего исходные данные для тренировки классификатора

3) “ToPredict.csv” – имя файла, содержащего записи об изменениях в тренде, которые система попытается объяснить

4) “Results.csv” – имя файла, в котором будут сохранены результаты работы программы

5) “linear” – алгоритм классификации, который будет использован программой. Поддерживаются следующие алгоритмы:

1. linear – Машина опорных векторов с линейным ядром и обучением пакетным методом

2. linearWithSGD - Машина опорных векторов с линейным ядром и обучением по методу стохастического градиентного спуска

3. rbf – Машина опорных векторов с Радиальной базисной функцией в качестве ядра, обучение пакетным методом

4. poly - Машина опорных векторов с Полиномиальным ядром, обучение пакетным методом

5. sigmoid - Машина опорных векторов с Сигмоидной функцией в качестве ядра, обучение пакетным методом

6. bayes – Наивный байесовский классификатор

После завершения программы в командной строке будет выведена информация о времени работы программы. В файл результатов будет записана информация о каждом изменении в тренде, которое система пыталась объяснить, и описание вероятной причины в данном изменении в тренде. Ниже приведен пример запуска программы в рабочем режиме.

Рис. 9. Работа системы классификации в рабочем режиме

 

Выводы

Реализована система, осуществляющая предобработку исходных данных о ценах на ценные бумаги и корпоративных событиях, связанных с ценными бумагами. Предобработка создает файл, содержащий информацию о том, какие корпоративные события происходили одновременно с какими изменениями в трендах цен. Далее данная информация передается системе классификации, которая производит преобразование по алгоритму TF-IDF и тренирует классификатор на базе одного из поддерживаемых алгоритмов. В ходе тренировки классификатор определяет, какие параметры корпоративных событий сопутствуют конкретным параметрам в изменениях трендов. Например, классификатор способен обнаружить, что в большинстве случаев одновременно со сломом тренда для ценных бумаг, торгующихся на московской бирже и выпущенных металлургическими компаниями, обычно происходит корпоративное событие связанное с китайскими автопроизводителями.

Обученный классификатор используется далее для поиска причин слома тренда цен переданных классификатору ценных бумаг.


Дата добавления: 2015-11-16; просмотров: 66 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Тестовый режим| Машинный эксперимент

mybiblioteka.su - 2015-2024 год. (0.006 сек.)