Читайте также:
|
|
Необходимо скопировать файл с программой FactGeneralizer.py в любую папку на пользовательском компьютере. Также необходимо скопировать нужные для работы файлы в любую папку на пользовательском компьютере. В случае работы программы в рабочем режиме необходимы два файла. Первый из них, содержащий пары «событие – изменение в тренде» будет использован для обучения классификатора. Второй должен содержать записи об изменениях в трендах, которые система попытается объяснить. Далее необходимо открыть командную строку и с помощью команды cd перейти в папку, в которой хранится файл FactGeneralizer.py. Для запуска программы в тестовом режиме необходимо ввести в командной строке следующую команду и нажать Enter:
python FactGeneralizer.py “work” “PriceFacts.csv” “ToPredict.csv” “Results.csv” “linear”
Значение параметров приведено ниже:
1) “test” – метка, обозначающая что программа будет работать в тестовом режиме
2) “PriceFacts.csv” - имя файла, содержащего исходные данные для тренировки классификатора
3) “ToPredict.csv” – имя файла, содержащего записи об изменениях в тренде, которые система попытается объяснить
4) “Results.csv” – имя файла, в котором будут сохранены результаты работы программы
5) “linear” – алгоритм классификации, который будет использован программой. Поддерживаются следующие алгоритмы:
1. linear – Машина опорных векторов с линейным ядром и обучением пакетным методом
2. linearWithSGD - Машина опорных векторов с линейным ядром и обучением по методу стохастического градиентного спуска
3. rbf – Машина опорных векторов с Радиальной базисной функцией в качестве ядра, обучение пакетным методом
4. poly - Машина опорных векторов с Полиномиальным ядром, обучение пакетным методом
5. sigmoid - Машина опорных векторов с Сигмоидной функцией в качестве ядра, обучение пакетным методом
6. bayes – Наивный байесовский классификатор
После завершения программы в командной строке будет выведена информация о времени работы программы. В файл результатов будет записана информация о каждом изменении в тренде, которое система пыталась объяснить, и описание вероятной причины в данном изменении в тренде. Ниже приведен пример запуска программы в рабочем режиме.
Рис. 9. Работа системы классификации в рабочем режиме
Выводы
Реализована система, осуществляющая предобработку исходных данных о ценах на ценные бумаги и корпоративных событиях, связанных с ценными бумагами. Предобработка создает файл, содержащий информацию о том, какие корпоративные события происходили одновременно с какими изменениями в трендах цен. Далее данная информация передается системе классификации, которая производит преобразование по алгоритму TF-IDF и тренирует классификатор на базе одного из поддерживаемых алгоритмов. В ходе тренировки классификатор определяет, какие параметры корпоративных событий сопутствуют конкретным параметрам в изменениях трендов. Например, классификатор способен обнаружить, что в большинстве случаев одновременно со сломом тренда для ценных бумаг, торгующихся на московской бирже и выпущенных металлургическими компаниями, обычно происходит корпоративное событие связанное с китайскими автопроизводителями.
Обученный классификатор используется далее для поиска причин слома тренда цен переданных классификатору ценных бумаг.
Дата добавления: 2015-11-16; просмотров: 66 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Тестовый режим | | | Машинный эксперимент |