|
Бородина А.И. ТЕХНОЛОГИИ БАЗ ДАННЫХ И ЗНАНИЙ
ВВЕДЕНИЕ В ТЕХНОЛОГИИ БАЗ ДАННЫХ И ЗНАНИЙ
Минск 2008
ВВЕДЕНИЕ В ТЕХНОЛОГИИ БАЗ ДАННЫХ И ЗНАНИЙ
ПЛАН
1. Предмет и содержание дисциплины. Ее связь с другими дисциплинами.
2. Экономическая информация. Виды и структурные единицы экономической информации.
3. Экономические информационные системы. Функции и классификация. Состав информационного обеспечения, информационная база.
4. Внемашинная организация экономической информации. Документы, их виды и структура. Классификация и кодирование информации.
5. Внутримашинная организация экономической информации. Файловая организация данных, ее недостатки. Понятие базы данных. Преимущества базы данных. Приложение базы данных. Компоненты базы данных.
АННОТАЦИЯ
Рассматривается предмет и содержание технологии баз данных и знаний, а также их связь с другими дисциплинами. Вводится понятие экономической информации; экономической информационной системы. Рассматривается внемашинная организация экономической информации: ее классификация и кодирование. Проводится анализ внутримашинной организация экономической информации: файловой организации данных, рассматривается понятие базы данных, приложения и компоненты базы данных.
1. ПРЕДМЕТ И СОДЕРЖАНИЕ ДИСЦИПЛИНЫ
«ТЕХНОЛОГИИ БАЗ ДАННЫХ И ЗНАНИЙ» И ЕЕ СВЯЗЬ С ДРУГИМИ ДИСЦИПЛИНАМИ
Чтобы понять предмет и содержание дисциплины «Технология баз данных и знаний» (ТБДЗ) нужно вначале определить, что такое технологии. Технологии - это точные знания или информация о некотором процессе производства или деятельности, обеспечивающие конечный результат с заданными параметрами. Например, технология варки стали, раскроя материала, варки борща. В нашем курсе нас будут интересовать информационные технологии, которые проникли во все сферы человеческой деятельности.
Концепции информационных технологий были высказаны Д. Мартином на рубеже 80-ых годов ХХ века. Как и всякие технологии, информационные технологии включают
• определенный набор материальных средств (носители информации, технические средства измерения ее состояния, обработки и т.д.) и способы их взаимодействия;
• специалистов и
• совокупность определенных методов организации работы.
Но в отличие от любой инженерной технологии, информационные позволяют интегрировать различные виды технологий, а информация, которую они обрабатывают в различных сферах деятельности, синтезируется для накопления опыта и внедрения в практику в соответствии с общественными потребностями. В последнее время все чаще говорят, что информационные технологии это не столько хранение, передача и переработка информации, сколько рычаг для преобразования предприятия для повышения эффективности его работы.
Первый шаг к информационным технологиям был сделан, когда компьютеры стали применяться для решения не только научных и инженерно - технических задач, но и задач, связанных с управлением деятельностью предприятий, планированием, информационным поиском в больших объемах данных. Второй шаг был сделан, когда появились персональные компьютеры, пригодные для использования людьми, не обладающими профессиональными знаниями в области программирования. Третий шаг - это соединение компьютеров в сети и присоединение их к базам данных и знаний. Таким образом, предмет дисциплины «Технологии баз данных и знаний» - научные знания о структуре и организации баз данных и знаний».
Содержание дисциплины «Технологии баз данных и знаний» (ТБДЗ) включает следующие вопросы:
• экономическая информация в автоматизированных информационных
системах;
• организация данных в базах;
• модели данных;
• системы управления базами данных и их функции;
• системы управления базами данных (СУБД);
• общая характеристика СУБД Access;
• создание базы данных и проектирование таблиц, запросов, форм, отчетов, страниц, макросов, модулей в СУБД Access;
• управление базой данных в СУБД;
• средства разработки приложений в СУБД Access;
• введение в язык SQL;
• проектирование реляционной базы данных;
• базы знаний.
Связь дисциплины ТБДЗ с другими дисциплинами можно представить в виде схемы (рис. 1).
Рис.1. Связь дисциплины ТБДЗ с другими дисциплинами |
На низшем уровне этой схемы стоит дисциплина «Техническое и программное обеспечение», с которой начинается знакомство с современными компьютерными информационными технологиями. Знания, полученные при изучении этой дисциплины, используются на следующем уровне, когда изучаются «Технологии баз данных и знаний» (ТБДЗ). Завершающими в этой иерархии является дисциплина: «Корпоративные информационные
системы» (КИС). А, в целом, знания, полученные при изучении компьютерных информационных технологий, используются в специальных дисциплинах, позволяя решать специализированные задачи в различных областях.
Вопросы для самоконтроля
1. Понятие технологии и информационных технологий.
2. Содержание дисциплины «Технологии баз данных и знаний».
3. Связь дисциплины «Технологии баз данных и знаний» с другими дисциплинами.
2. ЭКОНОМИЧЕСКАЯ ИНФОРМАЦИЯ 2.1. Структурные единицы экономической информации
Важнейшей составляющей управленческой информации является информация экономическая, которая отражает социально-экономические процессы как в сфере производства, так и в непроизводственной сфере, во всех органах и на всех уровнях отраслевого регионального управления.
Одним из методов изучения экономической информации является ее структурный анализ. Сущность его заключается в последовательном расчленении объекта, в результате чего выделяются его составляющие и устанавливаются связи между ними.
Экономическая информация, как правило, дискретна. Она передается определенными порциями, т.е. информационными совокупностями. Совокупности эти разнообразны по объему, составу и сложности заключенной в них информации. В зависимости от степени общности исследуемого объекта информационные совокупности могут быть разного уровня, иметь иерархическую структуру.
Элементарные неделимые на смысловом уровне единицы экономической информации принято называть реквизитами. Примеры реквизитов: наименование объекта, цена, количество. К реквизитам сводится любая информационная совокупность. Синонимами реквизитов являются: атрибут, элемент данных.
Вообще говоря, реквизиты не являются мельчайшими единицами информации: каждый из них может быть представлен совокупностью символов (буквенных и цифровых). Причем, элементарным символом является бит (двоичный символ: 0 или 1). Однако символы уже не имеют экономического смысла, а потому и не является единицами экономической информации.
По своему происхождению и роли в процессе обработки реквизиты подразделяются на основания и признаки. Основания характеризуют количественные свойства изучаемых процессов и явлений, например, цена. Признаки, как правило, - качественные, т.е. характеризуют обычно обстоятельства, при которых возникали те или иные количественные данные, например, наименование товара. Значениями основания являются числа, а значениями признаков - любые последовательности символов. В составе экономической информации преобладают признаки.
Каждое основание вместе с относящимися к нему признаками образует показатель. То есть, показатель есть единство одного основания и одного или несколько признаков (рис. 2).
|
1 Основание |
Показатель |
+ |
N Признаков
Рис. 2. Структура показателя
Показатели представляют собой минимум осмысленной информации о деятельности объекта, например, наименование и его цена. Это простейшие информационные совокупности, способные к документообразованию, Другими словами, показатель - это минимальная информационная совокупность, достаточная для образования самостоятельного документа. Они являются мельчайшими частицами, несущими в себе все признаки документа.
В процессе обработки информации основания являются наиболее активными элементами. Все арифметические действия, которые производятся над исходными показателями, производятся над их основаниями. На базе же признаков выполняется поиск нужных единиц информации, их выборка, объединение, подборка, упорядочение и т.п.
Элементы показателя, как и показатель в целом, можно рассматривать с двух точек зрения: по форме и по значению. Под формой понимается наименование граф, строк; а под значением - конкретные числа, коды и т.п. Характерно, что формы показателей в основном стабильны, значения же постоянно изменяются. При обработке информации для задания значений используют символы-шаблоны: 9., А и др. Цифра 9 используется для обозначения оснований, а буква А - для признаков, например:
9(5) - обозначает, что значение основания должно содержать не более пяти цифр;
99 - значение основания должно содержать не более двух цифр; 9(6).99 - значение основания должно содержать не более шести цифр в целой части и не более двух в дробной;
А(6) - значение признака должно содержать не более шести символов; ААА - значение признака должно содержать не более трех символов.
При исследовании экономической информации рассматривают информационные совокупности - составные единицы информации (СЕИ). СЕИ - это единица информации, состоящая из совокупности других единиц информации, ассоциативно связанных между собой. На практике структура СЕИ представляется в виде бланка, например: «Требование», «Накладная» и др. Можно представить СЕИ и в виде N-уровневого ориентированного графа типа дерева, в котором вершины отображают различные СЕИ, а дуги - информационные связи между ними. В последнем случае вершина первого уровня отображает рассматриваемую совокупность, а вершины последующих уровней есть составляющие подсовокупности рассматриваемой СЕИ. Связи между различными СЕИ указывают, какие СЕИ являются исходными для получения заданной СЕИ. Составная единица информации, имеющая юридическую силу, называются документом.
Каждое предприятие или его подразделение может рассматриваться как объект экономического управления. Следовательно, его функционирование связано с экономической информационной системой (ЭИС). Например, ЭИС предприятия включает плановые задания по выпуску продукции, численности работников, составу оборудования; учетные данные об учете труда и заработной платы и т.д. Очевидно, что существует возможность расчленения ЭИС на составляющие подсистемы, каждая из которых все еще обладает свойствами ЭИС. Например, ЭИС цеха и участка включает те же показатели, что ЭИС предприятия, но в масштабе цеха и участка соответственно.
Итак, низший структурный уровень экономической информации - символы (обозначения букв, цифр, специальных знаков). Следующий уровень образуют реквизиты, которые состоят из символов и являются единицами информации, характеризующими отдельные свойства объекта. Далее идут СЕИ - информационные совокупности самого низшего уровня. Видом СЕИ, очень важным для экономической информации, является показатель. Завершающим в этой лестнице является ЭИС объекта (рис. 3).
Рис. 3. Иерархия единиц информации |
Построенной структуре находится аналогия на языке семантики, а именно: низший структурный уровень информации - алфавитные, цифровые и другие элементарные знаки. Следующий уровень образуют слова. Из слов конструируются высказывания, которые являются первой структурной единицей языка - независимым носителем логического смысла. Сообщение, состоящее из одного высказывания, называется простым. Простое сообщение обычно имеет структуру простого грамматического предложения. Сложное сообщение всегда содержит два или более высказываний. Такое сопоставление позволяет построенную структуру информации назвать семантической структурой.
2.2. Измерение объема экономической информации
Измерение объемов экономической информации имеет большое значение при ее обработке. От объема информации зависит потребность в кадрах, распределение ее обработки по календарным периодам, составление графика обслуживания пользователей, а также выбор типа и модели вычислительной техники.
Любая единица измерения объема информации должна быть простой и удобной, наиболее полно отражать информационные процессы, способствовать изучению информационных взаимосвязей и взаимозависимостей отдельных задач. Объем экономической информации принято рассчитывать с помощью измерителей трех видов: носителей информации, структурных информационных единиц, символов.
Использование носителей информации в качестве измерителей объема удобно тогда, когда информация предварительно переносится на технический носитель. Измерение объема в носителях носит условный характер, так как технические носители даже одного типа, например, диски, содержат разное количество символов.
В качестве единицы информации используют также составные единицы информации - СЕИ. Практика документирования хозяйственных операций заставляет использовать такие СЕИ как документ и документо- строка.
Для измерения объемов информации используют и такие единицы, как реквизиты и показатели. Именно к ним можно свести любые структурные единицы информации. Объем информации в структурных единицах информации определяется по форме и значению. Для определения объема по форме используется следующая формула:
F = Z + C,
где Z и С - количество форм реквизитов соответственно в заголовочной и содержательной частях документа.
Для определения объема информации по содержанию используется формула:
S = Z + C*n,
где Z и С - количество значений реквизитов соответственно в заголовочной и содержательной частях документа; n - количество строк в документе.
Неудобством этого метода измерения объема является то, что как реквизиты, так и показатели в разных СЕИ имеют разную длину. Значит, измерение объемов в этом смысле носит условный характер.
Измерение объема в символах является наиболее универсальным, потому что в этих единицах можно измерить объем любой информации. Так как символы выполняют функции синтаксических единиц, то такую меру данных называют синтаксической.
В связи с применением ЭВМ, работающих в двоичной системе счисления, в качестве единицы измерения информации стали использовать двоичный разряд - бит. А поскольку 8 битов образуют байт, а 1024 байта - 1 килобайт, то информацию стали измерять в байтах и килобайтах, а затеи и в мегабайтах, гигабайтах, терабайтах, петабайтах.
Объем информации в символах определяется по формуле:
S=Z+C,
где Z - количество знаков в заголовочной части документа;
С - количество знаков в содержательной части документа.
Таким образом, объем информации в зависимости от целей исследования может быть измерен количеством документов, СЕИ, количеством показателей, количеством реквизитов с указанием их значимости в символах. Для всестороннего исследования структуры информации отдельных подсистем ЭИС необходим весь комплекс измерений ее объема. Так, измерение объема в документах необходимо, во-первых, для анализа документооборота. Во-вторых, на практике информация чаще всего фиксируется в документах, и обработке подвергается документированная информация. В- третьих, потому, что не зная количества документов, мы не сможем вычислить и количество реквизитов и символов.
Использование показателя оправдано тем, что измерять и анализировать информацию удобно, расчленяя ее на показатели, ибо более крупные информационные совокупности содержат элементы с разной характеристикой. Выделение показателей удобно и для выбора правильной внутренней структуры документа. К недостаткам же измерения объемов в показателях относится существенное завышение объемов представления информации.
Методы расчета количества информации должны позволять оценить объективно существующий поток экономической информации, который не зависит от используемых в данной системе форм документов. В этом случае наиболее удобно измерять объем информации в количестве реквизитов и символов. Это позволяет также правильно выбрать носители информации.
Как уже говорилось, каждую единицу информации (исключая символ) можно рассматривать со стороны ее формы, то есть наименования, и со стороны содержания, то есть конкретного значения данного наименования. В конечном счете, состав по форме характеризует разнообразие используемых сведений, а состав по содержанию - объем информации.
Имеется свой подход в измерении объемов информации в теории информации. Теория информации представляет собой как математическую, так и естественно научную дисциплину, включающую в себя различные области знания: некоторые приложения математической статистики, теории игр, распознавания образов и др. Основы теории информации были заложены в 1948-1949г.г. работами видного американского математика К.Шеннона. Большой вклад внесли в нее и русские математики А.Колмогоров и А. Хинчин, а также ученые-радиотехники В.Котельников и А. Харкевич.
В теории информации количество информации определяется как мера уменьшения неопределенности в знании некоторого события. В 1928г. Р.Хартли предложил измерять эту неопределенность величиной X = Log2 N,
где N - число равновозможных исходов события. При этом если использовать логарифм с основанием 2, то информация будет измеряться в двоичных единицах (битах).
В 1948 году К.Шеннон обобщил эту меру неопределенности на случай N исходов с разными вероятностями:
N
X = -£P(X)* Log2P(Xt)
i=1
где P(Xi) - вероятность исхода события Xi.
Нетрудно заметить, что формула Шеннона в случае N равновероятных исходов, то есть когда P(Xi)=1/N, превращается в формулу Хартли:
N
£ P(Xi)* Log 2 P(Xi) =
i=1
= P(X!) * Log2 P(X!) + P(X2) * Log2 P(X2) + Л + P(Xn) * Log2 P(Xn) =
=Log 2 N+N7*Log 2 N+Л Log 2 N =
N*r 1
= — * Log2— = N N
= Log21 - Log2 N = 0 - Log2 N = -Log 2 N; то есть Х = Log2 N.
Поясним приведенную выше формулу для двух событий. В этом случае единицей информации является ее количество, содержащееся в сообщениях о наступлении одного из двух равновероятностных исходов, имевших место в какой-либо системе, и вычисленное как сумма вероятностей при двоичном основании логарифмов:
ТЛ / 1 r 1 1 г 1ч 1
V = -(2 Log 22+2 Log 2 2) =1
Эта единица информации получила название бита (при других основаниях логарифмов могут быть получены другие единицы информации, например, при основании, равном 10, единица информации будет «дит»).
Рассмотрим для разъяснения этой единицы такой пример. Допустим, что продукцию некоторого предприятия покупают два других предприятия с равной вероятностью Однако, не известно, какой именно покупатель приобретает конкретную партию продукции. Извещение, что одно из предприятий приобрело продукцию, несет единицу информации - бит. Следовательно, после завершения события (приобретения конкретной партии продукции) вероятность состояния системы (закупка продукции предприятиями) достигнет единицы:
P = Log2(1: 2) = Log22 = 1 бит
Диапазон изменения значений вероятности в системах из двух исходов находится в пределах от нуля до единицы. Причем событие невозможное обладает нулевой вероятностью, а событие непременное - вероятностью, равной единице. Сообщение несет тем большее количество информации, чем значительнее изменяется величина вероятности с наступлением события в сравнении с первоначально ожидаемой величиной состояния системы. То есть сообщение о наступлении почти непременного события содержит ничтожное количество информации, в то время как сообщение о маловероятном событии несет много информации.
Допустим, что вероятность своевременной оплаты двумя покупателями приобретаемой ими продукции составляет соответственно 1/4 и 15/16. Тогда сообщение об уплате за продукцию в установленный срок этими покупателями соответственно будет нести различные количества информации:
Log2 (1:2) = 2 бита; Log2 (1: —) = 0,13 бита 4 16
То есть, сообщение об уплате в срок менее аккуратным покупателем несет
гораздо больше информации, чем сообщение об уплате продукции в срок
более дисциплинированным покупателем.
Рассмотрим еще один пример. Допустим, мы обращаемся в вышестоящую организацию с запросом: «В каком месяце коллектив предприятия должен выполнить запланированную ему на будущий год разработку новой машины?» Сколько информации будет содержаться в ответе: «В октябре?»
Поскольку этот ответ устраняет неопределенность, то в телеграмме содержится 3,6 двоичных единиц информации:
12 1 1
X = -У—Log 2 — = 3.6 дв.ед.
£12 212
Вопросы для самоконтроля
1. Понятие экономической информация, примеры.
2. Понятие реквизита, примеры.
3. Понятие реквизита-признака и реквизита-основания, примеры.
4. Понятие показателя, составной единицы измерения (СЕИ), документа, примеры.
5. Понятие экономической информационной системы, примеры.
6. Единицы измерения объема экономической информации.
3. ЭКОНОМИЧЕСКИЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ
Для удобства обработки информации создаются информационные системы. В широком смысле информационная система - это любая система, предназначенная для обработки информации. На практике используется и более узкая трактовка понятия информационной системы. В этом случае под информационной системой понимается совокупность аппаратно- программных средств, задействованных для решения некоторой прикладной задачи, например: система учета кадров, система бухгалтерского учета.
Внедрение информационных систем производится для повышения эффективности производственно-хозяйственной деятельности объекта за счет не только автоматизации выполнения рутинных операций, но и за счет принципиально новых методов управления, основанных на моделировании действий специалистов при принятии решений (методы искусственного интеллекта, экспертные системы и т.п.), использования современных средств телекоммуникаций (электронная почта, телеконференции), глобальных и локальных вычислительных сетей и т.д.
Экономическая информационная система (ЭИС) представляет собой систему, функционирование которой заключается в сборе, хранении, обработке и распространении информации о деятельности экономического объекта реального мира. Экономическая информационная система создается для конкретного экономического объекта и должна в определенной мере копировать взаимосвязи элементов этого объекта. Экономические информационные системы предназначены для решения задач обработки данных, автоматизации конторских работ, выполнения поиска информации, а также задач, основанных на методах искусственного интеллекта. Среди особенностей ЭИС следует назвать обработку больших объемов информации по сравнительно простым алгоритмам; высокий удельный вес логической обработки данных и представление подавляющей части информации в виде документов.
С функциональной точки зрения можно выделить такие классы ЭИС: системы обработки данных (СОД), автоматизированные системы управления (АСУ), информационно-поисковые системы (ИПС).
В зависимости от степени (уровня) автоматизации выделяют: ручные, автоматизированные, автоматические информационные системы. Ручные информационные системы характеризуются тем, что все операции по переработке информации выполняются человеком. Автоматизированные информационные системы - часть функций (подсистем) управления или обработки данных осуществляется автоматически, а часть - человеком. Автоматические информационные системы - все функции управления и обработки данных осуществляются техническими средствами без участия человека, например, автоматическое управление технологическими процессами.
Системы управления экономическими объектами относятся к классу сложных. В зависимости от организации систем управления возможны три варианта их структур: централизованный, децентрализованный, иерархический.
Централизованная обработка информации, наряду с рядом положительных сторон (высокая степень загрузки и высоко профессиональное использование оборудования, квалифицированный кадровый состав операторов, программистов, инженеров, проектировщиков вычислительных систем и т.п.), имеет ряд отрицательных черт, порожденных прежде всего отрывом конечного пользователя (экономиста, плановика, нормировщика и т.п.) от технологического процесса обработки информации.
Децентрализованные формы использования вычислительных ресурсов начали формироваться со второй половины 80-х годов, когда сфера экономики получила возможность перейти к массовому использованию персональных ЭВМ (ПЭВМ). Децентрализация предусматривает размещение ПЭВМ в местах возникновения и потребления информации, где создаются автономные пункты ее обработки. К ним относятся абонентские пункты (АП) и автоматизированные рабочие места (АРМ).
Развитие организационных форм использования вычислительной техники строится на сочетании централизованной и децентрализованной, т.е. смешанной формы.
Иерархическая структура предполагает подчинение каждого последующего уровня - предыдущему. Исключение в этом случае оставляет лишь первый уровень.
Эффективность применения той или иной структуры зависит от размерности объекта. Крупные и средние экономические объекты лучше функционируют при иерархической системе управления или при децентрализованной с обязательно жесткой координацией усилий; а малые - при централизованной.
По уровню применения и административному делению различают системы предприятия, района, города, области, государства.
По сфере применения можно выделить следующие классы информационных систем: научные исследования, автоматизированное проектирование, организационное управление, управление технологическими процессами.
Научные информационные системы предназначены для автоматизации деятельности научных работников, анализа статистической информации, управление экспериментом.
Информационные системы автоматизированного проектирования предназначены для автоматизации труда инженеров-проектировщиков и разработчиков новой техники (технологии). Такие системы помогают осуществлять: разработку новых изделий и технологий их производства, различные инженерные расчеты (определение технических параметров изделий, расходных норм), создание графической документации, моделирование проектируемых объектов, создание управляющих программ для станков с числовым программным управлением.
Информационные системы организационного управления предназначены для автоматизации работы административного персонала. К этому классу относят системы управления как промышленными (предприятия), так и непромышленными объектами и отдельными офисами.
Информационные системы управления технологическими процессами предназначены для автоматизации различных технологических процессов: гибкие производственные процессы, металлургия, энергетика.
В экономике с учетом сферы применения выделяют:
• Банковские информационные системы;
• Информационные системы фондового рынка;
• Страховые информационные системы;
• Налоговые информационные системы;
• Статистические информационные системы;
• Бухгалтерские информационные системы и др.
Современная система управления экономическим объектом представляет собой человеко-машинный комплекс со следующими основными подсистемами:
• Информационное обеспечение - система классификации и кодирования информации, технологическая схема обработки данных, нормативно- справочная информация, система документооборота.
• Техническое обеспечение - комплекс используемых в системе управления технических средств, включающих ЭВМ и средства связи.
• Математическое обеспечение - совокупность методов, правил, математических моделей и алгоритмов решения задач.
• Программное обеспечение - совокупность программ систем обработки данных и документов, необходимых для эксплуатации этих программ.
• Лингвистическое обеспечение - совокупность терминов и искусственных языков, правил формализации естественного языка.
• Правовое обеспечение - совокупность правовых норм, определяющих создание, юридический статус и функционирование системы.
• Организационное обеспечение - совокупность мер и мероприятий, регламентирующих функционирование системы управления, ее описание, инструкции и регламенты обслуживающему персоналу.
Информационное обеспечение представляет собой информационную базу объекта. Она включает потоки внутренней и внешней информации. Разработка информационного обеспечения - это определение состава учетных показателей; внедрение унифицированной системы документации; использование общегосударственных, отраслевых и локальных классификаторов. Рассмотрим эти составляющие более подробно.
Все хозяйственные операции регистрируются в первичных документах, которые представляют собой полное и достоверное письменное свидетельство о совершении хозяйственных операций. Первичные документы бывают типовыми, которые утверждаются соответствующими органами, и нетиповыми. Общее методическое руководство по их формированию и применению осуществляется Министерством финансов и Министерством статистики РБ.
Типовые документы делятся на межотраслевые и отраслевые. Межотраслевые являются едиными для применения на всех предприятиях и в организациях. К ним относятся кассовые и платежные документы, документы по учету основных средств и др. Отраслевые носят рекомендательный характер. На их основе каждая отрасль может разрабатывать свои формы документов с учетом специфики конкретной отрасли. Отраслевые документы применяются на участках учета труда и заработной платы, учета материалов и др.
Вопросы для самоконтроля
1. Понятие экономической информационной системы.
2. Классификация экономических информационных систем по степени автоматизации.
3. Классификация экономических информационных систем в зависимости от организации.
4. Классификация экономических информационных систем по сфере применения.
5. Основные подсистемы системы управления экономическими объектами и их функции.
6. Информационная база и ее характеристика.
7. Классификаторы.
4. ВНЕМАШИННАЯ ОРГАНИЗАЦИЯ ЭКОНОМИЧЕСКОЙ ИНФОРМАЦИИ
Обрабатываемая информация может быть представлена в двух видах: внемашинной и внутримашинной.
К внемашинной относится та часть информации, которая обслуживает системное управление в виде, воспринимаемом человеком без каких-либо технических средств, например, документ: наряды, акты, накладные, счета, ведомости и др.
Формой представления внемашинной информации являются документы. Документ - это информационное сообщение на естественном языке, зафиксированное ручным или печатным способом на бланке установленной формы и имеющее юридическую силу.
Структурно документ должен включать следующие разделы:
• Заголовочная часть - это наименование и характеристика документа, зона для проставления кодов, постоянные реквизиты и характеристики;
• Содержательная часть - это место, где располагаются показатели;
• Оформительная часть - содержит подписи юридических лиц, дату составления, печать.
Документы классифицируют по ряду признаков:
• Сфере деятельности (плановые, учетные, статистические, банковские, финансовые и т.д.);
• Отношению к объектам управления (входящие, исходящие);
• Содержанию хозяйственных операций (материальные, денежные);
• Назначению (распорядительные, исполнительные, комбинированные);
• Способу заполнения (заполняемые с помощью технических средств и заполняемые вручную).
Внемашинное информационное обеспечение включает внемашинную информационную базу и средства организации и ведения информационной базы. Внемашинная информационная база подразделяется на нормативно- справочную информацию, которая мало меняется во времени, и оперативную, фиксирующую оперативно меняющиеся данные. Например: номенклатурные ценники - это нормативная информация, а приходно-расходные ордера - оперативная. К средствам организации и ведения информационной базы относятся системы классификации и кодирования информации, системы организации и ведения документации.
Внутримашинная информация - содержится на машинных носителях и состоит из файлов. Внутримашинное информационное обеспечение включает внутримашинную информационную базу и средства организации и ведения этой информационной базы. Внутримашинную информационную базу можно создать либо как множество локальных, т.е. независимых файлов, каждый из которых отражает некоторое множество однородных «управленческих» документов (например, накладных), либо как базу данных. К средствам организации и ведения базы относят соответствующие программные средства: СУБД, Сервисные средства, прикладные программы пользователя, инструкции.
При изучении внемашинной части экономической информации важно ее правильно классифицировать и кодировать.
4.1. Классификация экономической информации
Для представления информации, содержащейся в документах, в форме, удобной для ввода и обработки, используется классификация и кодирование информации. Классификация - это распределение множества объектов на подмножества в соответствии признаками сходства и различия. Совокупность правил классификации и результата классификации называется системой классификации.
При классификации экономической информации наиболее широко используют иерархическую и фасетную системы классификации. Под иерархической системой понимают такую систему, в которой между классификационными группировками установлено отношение подчинения. Классифицируемое множество объектов делиться по некоторому выбранному признаку на крупные группировки, затем каждая группировка разбивается на ряд последующих группировок, которые в свою очередь распадаются на более мелкие, постепенно конкретизируя объект классификации. Например, группу людей по росту можно разбить на две подгруппы: до 150 и выше 150 см. Затем группу с ростом выше 150 см можно снова разбит на более мелкие подгруппы: 151-160; 161-170; выше 171 см и т.д.
Под фасетной системой классификации понимают такую систему, при которой классифицируемое множество образует независимые группировки по различным аспектам классификации. Она не имеет жесткой классификационной структуры и заранее построенных конечных группировок. При ней множество объектов, характеризующихся некоторым набором признаков (фасетов), значения которых соответствуют конкретным выражениям указанных признаков, делится многократно и независимо. Например, ту же группу людей можно классифицировать по полу, затем независимо от пола - по возрасту, затем независимо от возраста - по месту жительства.
Наиболее общим направлением классификации экономической информации можно считать ее деление по таким признакам, как:
• сфера возникновения и потребления,
• стадия возникновения,
• функции управления,
• стабильность,
• полнота,
• отношение к процессу обработки и хранения,
• истинность,
• способ отражения,
• отношение к входу и выходу,
• форма сигналов.
Классификация информации по каждому из этих признаков способствует ускорению процесса ее обработки. Так, классификация по функциям управления позволяет правильно выделить функциональные подсистемы, что дает возможность разработать коды, организовать сортировку информации, подводить итоги по группам. Выделение стабильной и нестабильной, истинной и неистинной информации создает условия для проверки достоверности исходной и результативной информации и т.д.
По сфере возникновения и потребления экономическая информация подразделяется на внутреннюю и внешнюю. Внутренняя - возникает и циркулирует внутри объекта. Внешняя поступает в объект извне. Выделение внешней информации позволяет в системах правильно определить и оценить информационные связи одной системы с системой других уровней управления.
По стадиям возникновения информацию делят на первичную и вторичную. Первичная информация возникает на начальной стадии управления в результате действия источника информации. Эта информация не подвергается вычислительной обработке, она лишь фиксируется в момент возникновения. Вторичная информация, называемая еще производной, представляет собой результат обработки как первичной, так и любой другой информации. Во вторичной информации, в свою очередь, выделяют информацию промежуточную и результативную.
Промежуточная информация является результатом расчетов и используется в качестве исходной для решения других задач. Результатная информация - это результат расчетов, использующихся при управлении работой экономического объекта.
Для получения первичной информации выполняются процедуры ее сбора, регистрации и передачи. А для получения результативной - процедуры обработки, хранения, размножения и поиска. В зависимости от характера решаемой задачи процедуры выполняются в определенной последовательности при помощи соответствующих технических средств и образуют технологический процесс обработки информации.
По функции управления выделяют информацию учетную, плановую, финансовую, нормативную, прогнозную, конструкторско-
технологическую.
Функции управления включают в себя:
• уровень производства (народное хозяйство, отрасль, подотрасль, объединение, предприятие, структурные подразделения предприятия);
• элементы производства (предметы труда, средства труда, труд, готовая продукция и др.);
• стадии управления (прогнозирование, нормативная информация, плановая, учетная и др.).
Для выполнения многих функций производства недостаточно экономической информации, требуется еще и техническая информация. Часть технической информации, используемой совместно с экономической, называется нормативной. Для автоматизированной обработки экономической информации наиболее часто используется нормативная, плановая и учетная. Плановая информация делится на информацию перспективного, технико-экономического и оперативно-производственного планирования. А учетная - бухгалтерского учета, статистического учета и оперативно- технического учета.
По стабильности экономическую информацию подразделяют на переменную, постоянную, условно-постоянную.
Переменная информация изменяется за достаточно короткие периоды. В экономических задачах к переменной информации относят ежедневную, месячную информацию. Переменная информация обычно участвует в одном технологическом цикле машинной обработки. Постоянная информация не изменяется в течение продолжительного периода. Это справочные сведения, нормативы, расценки и т.п. Для оценки постоянства информации используют коэффициент стабильности. Информация считается постоянной, если коэффициент стабильности выше значения 0,85. К условно- постоянной информации относят информацию с коэффициентом стабильности равным 0,5-0,85.
По полноте информацию делят на достаточную, недостаточную, избыточную. При недостаточной информации решить задачу порой вообще невозможно.
По истинности, т.е. по критерию соответствия отражаемым явлениям выделяют информацию достоверную и недостоверную. Недостоверная информация ведет к ошибкам в управлении, к сокрытию недостатков.
По отношению к процессу обработки и хранения экономическую информацию подразделяют на обрабатываемую и необрабатываемую. В экономических информационных системах некоторая часть информации не подвергается обработке и называется необрабатываемой. Она складывается из входящей внешней информации и входящей внутренней. При выходе из экономической информационной системы необрабатываемая информация подразделяется на исходящую внешнюю и исходящую внутреннюю.
Другая часть информации участвует в процессе обработки и называется обрабатываемой. Она складывается из входящей внешней информации и входящей внутренней. В результате обработки получается, как правило, новая информация, которая называется производной. Производная информация в свою очередь подразделяется на два потока: исходящую внешнюю (результативную), которая вместе с необрабатываемой исходящей внешней информацией образует исходящую информацию экономической информационной системы: и исходящую внутреннюю (промежуточную), которая потребляется объектом управления и вместе с необрабатываемой внутренней информацией составляет поток исходящей внутренней информации экономической информационной системы. Обычно промежуточные показатели не имеют самостоятельного значения и выводятся лишь для облегчения вычислений и контроля.
Довольно часто одна и та же информация и потребляется (является результатной), и продолжает функционировать при дальнейшей обработке (является промежуточной) одновременно.
В процессе обработки из известных исходных показателей должны быть получены неизвестные результатные показатели. В получении результатных показателей заключается вся цель обработки. При этом должен соблюдаться принцип: минимум исходных показателей и максимум производных.
По отношению к входу, выходу системы выделяют информацию входящую и исходящую. С кибернетической точки зрения экономическую информационную систему объекта можно рассматривать как «черный ящик», который на входе получает некоторую информацию, а на выходе выдает, вообще говоря, уже другую информацию. Информацию, поступающую в данную информационную систему, называют входящей, а информацию, получаемую на выходе, - исходящей.
Как входящая, так и исходящая информация подразделяется на внешнюю, связанную с внешним по отношению к данному объекту миром, и внутреннюю, связанную непосредственно с управляемым объектом. Внешняя информация разрабатывается вне данного объекта и характеризует его производственно-хозяйственные отношения с другими объектами. Она представляет в общем объеме информации небольшой процент, что в значительной степени снижает к ней интерес. Внутренняя информация получается на объекте.
Входящая внутренняя информация, называемая обычно первичной, является основой для регулирования объектом. В выработке исходящей внутренней информации фактически заключается весь смысл управления. Внутренняя информация (исходящая и входящая) осуществляет прямую и обратную связь экономической информационной системы с объектом управления.
По форме сигналов представления информацию делят на дискретную (в виде цифр, букв) и непрерывную (в виде кривых). Дискретная информация в ЭВМ передается набором символов. Символ - это буква, цифра или служебный знак, изображенный в данном алфавите. Символы объединяются в слова. Слово - это один или несколько символов, сгруппированные для машинного представления. Совокупность слов переменной длины, логически связанных между собой и представляющих единое целое, называется записью. Записи объединяются в файлы. Файл - группа записей, имеющих одинаковую организацию и структуру и относящихся к одноименным объектам.
4.2. Кодирование экономической информации
Важным вопросом при обработке информации является ее кодирование. Кодирование вызвано необходимостью передачи информации по каналам связи, хранения ее на внешних носителях и обработки с помощью технических средств. Кодирование позволяет более экономно изображать и систематизировать информацию. Закодированную информацию часто удобнее воспринимать зрительно, ее легче передавать, обрабатывать и использовать. Коды позволяют уменьшить объем информации, облегчить запись на машинные носители, поиск и сортировку информации. Кодирование повышает также надежность информации.
Согласно единой системе классификации и кодирования технико- экономической информации (ГОСТ 17369-78) кодирование - это образование и присвоение объекту классификации, признаку классификации и (или) классификационной группировке кодового обозначения. Кодовое обозначение - это обозначение объекта классификации, признака классификации и (или) классификационной группировки знаком или группой знаков в соответствии с принятым методом кодирования. Известны следующие метода кодирования информации:
• порядковый;
• серийно-порядковый;
• последовательный;
• параллельный.
Порядковый - это такой метод кодирования, при котором кодовыми обозначениями служат числа натурального ряда (ГОСТ 17369-78). При порядковом методе каждой единице информации присваивается номер по порядку без какого-либо пропуска номеров. Новые элементы получают номера в конце имеющегося перечня. Здесь никакой предварительной классификации не требуется. Последовательность присвоения кодов определяется чаще всего хронологией возникновения информации. Примером использования порядкового метода кодирования является систематизация домов на улице, квартир в доме.
Удобство этого метода в простоте. А к недостаткам можно отнести отсутствие всякой классификации, невозможность вставить элемент внутрь. Нет возможности выделить группы однородных признаков. Все это усложняет обработку данных на ЭВМ. Поэтому этот метод кодирования рекомендуется использовать для небольших, простых и постоянных множеств. Например, категорий работающих, видов образования, национальностей,
единиц измерения. В качестве примера рассмотрим кодирование единиц измерения:
Единица измерения | Код |
Миллиграмм | |
Грамм | |
Килограмм | |
Центнер | |
Тонна | |
Метр | |
Пара | |
Штука |
Серийно-порядковый - это такой метод кодирования, при котором кодовыми обозначениями служат числа натурального ряда с закреплением отдельных диапазонов (серий) этих чисел за объектами классификации с одинаковыми признаками (ГОСТ 17369-78). Серийно-порядковый метод кодирования предполагает разделение информации по какому-либо признаку на отдельные части (серии). Для каждой серии отводится своя группа условных обозначений. При этом номера единиц информации последующих серий не продолжают строго последовательно номера имеющихся единиц информации предыдущей серии: между ними делается разрыв. Примером может служить кодирование цехов на предприятиях. Так, если имеется 10 основных цехов и 3 вспомогательных, то их можно закодировать следующим образом: 01, 02,..., 19; 25, 26, 27.
Серийно-порядковый метод используется для множеств, имеющих классификацию по двум признакам: старшему признаку отводится своя группа номеров, внутри которой все элементы младшего признака кодируются по порядку. Поэтому этот метод и называется серийно-порядковым. Размер серии устанавливается с учетом количества элементов младшего признака и необходимости резерва свободных номеров на случай расширения. Для новых номеров отводятся кодовые обозначения из резерва свободных номеров соответствующей серии. Этот метод опирается на иерархическую систему классификации.
Серийно-порядковый метод обеспечивает получение итогов по сериям, но лишь по одному классификационному признаку. Он позволяет сохранять принцип серийности при расширении номенклатуры. Но так как предвидеть запас кодов трудно, то на практике серийность порой нарушается. Поэтому к недостаткам этого метода кодирования относится то, что размер серии не всегда можно предусмотреть. Серийно-порядковый метод удобен для относительно устойчивых номенклатур. Так, его рекомендуется использовать для кодирования цехов, видов оплат и удержаний.
Последовательный - это такой метод кодирования, при котором в кодовом обозначении последовательно указываются зависимые признаки классификации (ГОСТ 17369-78). Последовательный метод кодирования предполагает наличие иерархической организации информации или разделение ее по ряду признаков. Суть его в том, что каждый признак обеспечивается своей нумерацией в пределах всего признака. Здесь все элементы классифицируются по определенным признакам, и каждому из них отводится свое число позиций (разрядов) в соответствии с количеством элементов данной группировки. Последовательная система кодирования обычно используется при иерархической системе классификации.
Рассмотрим в качестве примера последовательного метода кодирования присвоение кодовых обозначений наименованиям материалов. Предположим, надо закодировать классификатор материалов по укрупненной номенклатуре. Для этого материалы делят на классы, каждый класс - на подклассы, подкласс - на группы, группы - на подгруппы, а каждая подгруппа содержит определенное количество наименований, сортов и размеров материалов (табл.1). Например: класс - это основные материалы и вспомогательные материалы; подкласс - это черные металлы, цветные металлы и т.д.; группа - это чугун, сталь и т.д.; подгруппа у чугуна может быть: круглый и т.п.; и наконец, всякий материал имеет сорт и размер.
Таблица 1 Присвоение кодовых обозначений наименованиям материалов
|
В целом, как видно из таблицы, длина кодового обозначения в нашем примере равна 9 позициям. При использовании последовательного метода кодирования эти 9 позиций распределяются так: классы - 2; подклассы - 1; группы - 1; подгруппы - 2; сорт, размер - 3.
Из приведенной таблицы можно получить, например, следующие коды: 01101001 и 012205050 и др.
Количество элементов в каждой классификационной группировке может быть, например, таким (рис.4): классы - 15 элементов, подклассы - 9, группы - 9, подгруппы - 12, сорт, размер - больше 100, но меньше 1000.
Рис. 4. Иерархическая схема классификации материалов |
Подклассы |
Подгруппы |
Сорт, размер |
Классы
Группы
|
Параллельный - это такой метод кодирования, при котором в кодовом обозначении объекта классификации или классификационной группировке указываются независимые признаки классификации (ГОСТ 1736978). Параллельная система кодирования чаще используется при фасетной системе классификации. В качестве примера рассмотрим классификацию сотрудников предприятия. Здесь можно учитывать следующие классификационные признаки: пол, возраст, образование, семейное положение и др. Очевидно, что все эти признаки не зависят друг от друга. Структура кода может быть такой:
• табельный номер сотрудника - 3 символа;
• пол - 1 символ;
• возраст - 2 символа;
• образование - 1 символ,
• семейное положение - 1 символ.
Удобством последовательного и параллельного методов кодирования является четкое выделение каждого классификационного признака, стройность построения, удобство при обработке на ЭВМ. Недостаток этих методов - их сложность и громоздкость. Эти методы используются обычно при кодировании больших многопризначных номенклатур.
Для поддержки различных систем классификации и кодирования разрабатываются специальные документы, называемые классификаторами. В
республике Беларусь имеется Единая система классификации и кодирования (ГОСТ 173689-78), в которой определяется такое понятие, как классификатор. Классификатор - это систематизированный свод наименований объектов классификации, признаков классификации и (или) классификационных группировок и их кодовых обозначений. Классификаторы бывают: общегосударственные; отраслевые и локальные.
■ Общегосударственные классификаторы утверждаются и регистрируются в государственном стандарте РБ и применяются организациями разной ведомственной принадлежности - единые для республики. К ним можно отнести общегосударственный классификатор предприятий и организаций.
К 2008 году Республика Беларусь окончательно перейдет к классификации экономической деятельности по международным нормам. Согласно этим нормам статистическая информация будет обрабатываться по Общегосударственному классификатору видов экономической деятельности (ОКЭД), принятому Европейским союзом. На этот классификатор переходят все страны СНГ.
Согласно ОКЭД все виды экономической деятельности делятся на: добывающие, обрабатывающие и предоставляющие услуги. К добывающим относят: деятельность, связанную с производством сельскохозяйственной продукции, охотой, лесным хозяйством, рыболовством и рыбоводством. К обрабатывающим - переработку сырья, производство и распределение электроэнергии, газа и воды. Остальные - относятся к предоставляющим услуги.
Виды экономической деятельности по ОКЭД делятся на пять вертикальных уровней: четыре первых соответствуют классификации видов Европейского союза, а пятый является специфическим, то есть национальным.
■ Отраслевые классификаторы применяются внутри министерства или ведомства. Они используются для кодирования информации, специфичной для данной отрасли. К ним относят классификаторы кодов видов оплат и удержаний из заработной платы, видов операций движения материальных средств.
■ Локальные классификаторы предприятий применяются внутри предприятия, производственного объединения и других подразделений министерств и ведомств. Локальные коды - это индивидуальные коды. Они характерны только для конкретного предприятия.
Классификаторы и коды используются для составления отчетов, сводок и группировки.
4.3. Штрих код
Мировая система штрих кодирования сложилась в конце 80-х годов. Сегодня используются два ее стандарта: американский UPC с 12 цифрами и европейский EAN с 13 цифрами. В России штрих коды, начинающиеся с цифр 46, присваивает ассоциация ЮНИСКАН, которая является членом EAN. Такие ассоциации есть и в других странах.
С помощью первых двух-трех цифр кода легко определить, в какой стране сделан товар (табл. 2).
Таблица 2
Штрих коды некоторых стран
|
Рассмотрим для примера код 5601721110013, состоящий из 13 цифр (система EAN-13). Первые две цифры (56) - страна, следующие пять (01721) - код предприятия, другие пять (11001) - зашифрованные потребительские свойства (причем первая цифра из этих пяти скрывает имя товара, вторая особенности его потребительских свойств, третья - массу, четвертая - состав, пятая - цвет) и последняя цифра - контрольная.
Но бывают и несоответствия. Например, согласно штрих-коду товар должен быть сделан на Тайване, а буквами написано - Made in Germany. Это может быть либо подделка, либо фирма производит товар в Германии, но штрих-код зарегистрировала на Тайване, либо на Тайване у нее филиал, либо она работает по тайваньской лицензии, либо это совместное германо- китайское предприятие.
На штрих-коде могут быть только штрихи, а цифр не быть или штрих- код может быть узким или коротким. Это - не признак подделки. Для лазерного кассового аппарата цифры вообще не имеют значения, и, если места на товаре мало, их не ставят. Обычно так бывает на мелких по размерам товарах. ЮНИСКАН разрешает производителям таких товаров использовать сокращенные варианты кодировки.
Следует помнить, что штрих коды - это не гарантия подлинности. В них нет информации об экологической чистоте продукта и нет также указания на цену. Когда товар поступает в продажу, в компьютер заносятся данные о его штрих коде и цене, так что кассовый аппарат распознает, с каким товаром он имеет дело, и высвечивает заложенную цену.
Есть способ, позволяющий узнать, является ли товар поддельным. Для этого нужно произвести следующие арифметические действия:
1. Сложить цифры, стоящие на четных позициях, в нашем примере: 6+1+2+1+0+1+11.
2. Сумму умножить на три: 11*3=33.
3. Сложить цифры, стоящие на нечетных позициях, не считая контрольной цифры: 5+0+7+1+1+0=14.
4. Сложить то, что получилось в результате второго и третьего действий: 33+14=47.
5. От результата отбросить первую цифру - получится 7.
6. И отнять от 10 то, что получилось в пятом пункте: 10-7=3.
Этот результат должен совпадать с контрольной цифрой. Если нет - товар поддельный.
Вопросы для самоконтроля
1. Классификация экономической информации по различным признакам.
2. Порядковый метод кодирования, примеры.
3. Серийно-порядковый номер кодирования, примеры.
4. Параллельный метод кодирования, примеры.
5. Последовательный метод кодирования, пример.
6. Понятие классификатора, типы классификаторов.
7. Штрих коды.
5. ВНУТРИМАШИННАЯ ОРГАНИЗАЦИЯ ДАННЫХ 5.1. Файловая организация данных
В первые годы автоматизированной обработки информации (50-е - начало 60-х годов ХХ века) использовалась файловая организация данных. Данные хранились в файлах последовательного доступа. Файл - это специальным образом организованная и поименованная совокупность данных, размещенных на внешних запоминающих устройствах и воспринимаемых в процессе обработки как единое целое. Прикладные программы обрабатывали файл целиком. В 60-е годы, когда широко распространились устройства прямого доступа (магнитные диски), приобрели популярность файлы произвольного доступа. Этот метод доступа к данным позволил напрямую обращаться к нужной записи и не обрабатывать весь файл.
По мере совершенствования методов управления народным хозяйством создавались автоматизированные информационные системы, которые поначалу имели файловую организацию данных. Такие системы обладали рядом недостатков:
• жесткая связь данных и прикладных программ: описание данных включалось непосредственно в программу; значит если изменялась организация данных, то переделывалась и программа, что требовало больших затрат труда программиста. В результате программы оказывались узкоспециализированными;
• дублирование данных за счет того, что одни и те же данные использовались в разных программах и в результате этого большие затраты на процесс обработки данных;
• ограниченные возможности в обработке данных, так как любая их обработка требовала создания своей программы, а значит низкая скорость обработки в целом всех данных;
• ограниченный контроль данных;
• отсутствие надежных средств в обеспечении сохранности и целостности данных;
• недостаточные возможности управления данными.
Недостатки файловой организации, а также необходимость централизации данных, коллективного доступа к ним, повышенные требования к скорости обработки и достоверности данных обусловили появление баз данных (БД), которые позволили обеспечивать более эффективный доступ к данным и их обработку.
5.2. Понятие базы данных
Термин база данных обычно связывают с компьютерами. В действительности базы данных появились задолго до компьютеров. Представление о базе данных может дать записная книжка, заполненная однотипными записями, содержащими, например, такие данные: фамилии, имена, отчества, телефоны, адреса, даты рождения. Другими примерами базы данных может служить библиотечная картотека, картотека учет кадров, расписание движения поездов. То есть любая база данных содержит набор данных, представляющих собой совокупность взаимосвязанных сведений о некотором объекте.
Дата добавления: 2015-11-04; просмотров: 43 | Нарушение авторских прав
<== предыдущая лекция | | | следующая лекция ==> |
Зарубежный ВУЗ. Подготовка | | | Aide et soutien aux patients atteints moralement. |