Учебная работа. Дипломная работа: Автоматизированная интеллектуальная система классификации информационных сообщений средств массовой

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...
Контрольные рефераты

Учебная работа. Дипломная работа: Автоматизированная интеллектуальная система классификации информационных сообщений средств массовой

ДИПЛОМНЫЙ ПРОЕКТ

Выпускная квалификационная работа дипломированного спеца

Специальность 230102

Автоматические системы обработки инфы и управления

АВТОМАТИЗИРОВАННАЯ ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА КЛАССИФИКАЦИИ ИНФОРМАЦИОННЫХ СООБЩЕНИЙ СРЕДСТВ МАССОВОЙ инфы


Содержание

Введение

1. Обзор и анализ имеющихся систем

2. Общесистемные решения

2.1 Объяснительная записка к техническому проекту

2.2 Описание схемы организационной структуры управления информационных и аналитических технологий аппарата администрации Тульской области

2.3 Описание автоматизируемых функций и схемы многофункциональной структуры АИС «Классификатор»

2.4 Описание постановки задачки

3 Информационное обеспечение

3.1 Список входных данных

3.2 Список выходных данных и документов

3.3 Описание информационного обеспечения АИС «Классификатор»

3.4 Описание организации информационной базы

4 Математическое обеспечение

4.1 Математическая постановка задачки систематизации информационных сообщений СМИ

4.2 Описание способа нечеткого поиска

4.3 Описание запросов

4.4 Описание схемы работы системы

5. Техническое обеспечение

5.1 Описание комплекса технических средств

5.2 инструкция по эксплуатации комплекса технических средств

6 Программное обеспечение

6.1 Описание программного обеспечения

6.2 Описание контрольного примера

7 Организационное обеспечение

7.1 Описание организационной структуры

7.2 Управление юзера

Заключение

Библиографический перечень

Приложения

1. структура входных и выходных документов

2. Текст программки.


ВВЕДЕНИЕ

При современном уровне развития информационных технологий внедрение компа для хранения всех видов инфы становится единственным методом, предоставляющим широчайшие способности по управлению информацией.

В истинное время идет неизменный и резвый рост размеров инфы. Значительную часть данной инфы составляют текстовые данные. В связи с сиим встает неувязка сотворения средств доступа к текстовой инфы.

На техническом уровне существует возможность доступа к значимой части имеющихся текстов, но фактически доступна только малая часть. Это соединено с несовершенством средств доступа. Современные средства поиска, каталогизации, описания текстов не удовлетворяют нарастающим потребностям юзеров. Требуется их развитие в направлении увеличения эффективности поиска инфы и упрощения взаимодействия с юзером.

Вероятным методом решения задачи является создание технико-информационных средств описания смысла имеющихся текстов с возможностью предстоящего осмысленного поиска в массиве текстовой инфы. При этом огромные и повсевременно увеличивающиеся объемы текстовой инфы требуют, чтоб такие средства работали в автоматическом режиме.

Более принципиальным направлением автоматизации деятельности компаний является внедрение современных информационных технологий для хранения, классификации и действенной обработки инфы, поступающей из разных источников, также использования данной инфы в целях выработки советов для принятия управленческих решений.

неувязка использования огромного размера скопленных данных является главный в почти всех организациях. неувязка работы с огромным количеством инфы имеет два нюанса:

— автоматический сбор инфы;

— автоматический разбор поступившей инфы по данной теме, проведенный на базе анализа текста документа.

В связи с сиим, во-1-х, возникает задачка загрузки инфы в систему. процесс загрузки заключается в занесении данных с носителя инфы в хранилище данных. Поставляющие информацию оперативные системы далековато не постоянно владеют достаточным уровнем свойства данных, потому процесс загрузки этих данных в хранилище не ограничивается обычным копированием, а содержит в себе чистку, согласование и контроль свойства. Хранилища данных загружают и повсевременно обновляют большие объемы данных из разных источников, потому возможность попадания в их «запятанных данных» очень высока. Потому возникает неувязка поиска и подборки нужной инфы из огромных массивов текстовых данных.

Эффективность поиска в большенном информационном массиве значительно повысится, если его разбить на части по некому аспекту, связанному с целями поиска. Как следует, во-2-х, возникает неувязка систематизации сообщений. Для решения задачки анализа текстовой инфы и следующего автоматического распределения ее по требуемым тематикам нужно сначала сформировать рубрикатор, другими словами задать перечень рубрик и словарь, более буквально характеризующие исследуемую область познаний. систематизация документов дозволяет сузить область поиска и не только лишь прирастить его скорость, да и существенно повысить точность результатов. Потому технологии автоматической систематизации документов отводится принципиальное пространство в системах управления электрическим документооборотом.

Сущность задачки систематизации состоит в автоматическом распределении поступающих в систему документов зависимо от их типа и содержания по рубрикам.

В истинное время в структуре областной исполнительной власти ответственность за поддержание информационного тонуса в регионе возложена на управление информационных и аналитических технологий аппарата администрации Тульской области (УИАТ ТО), одной из задач которого является создание критерий для ублажения информационных потребностей органов власти, населения.

В целях обеспечения информацией органов власти и населения больше внимание уделяется совершенствованию проф мастерства рабочего персонала отдела технологий отображения инфы (ОТОИ) УИАТ ТО, увеличению оперативности и эффективности работы. ОТОИ производит свою деятельность в сфере управления действиями сотворения и внедрения передовых информационных технологий и в сфере управления вопросцами графической обработки и отображения инфы.

Внедрение системы автоматизации в технологические процессы отделов по управлению информацией дозволяет очень применять их способности:

— автоматизация процесса загрузки информационных сообщений СМИ в информационную базу системы дозволяет сделать лучше свойство данных, выявить и удалить ошибки несоответствий в данных;

— автоматизация процесса поиска дозволяет отчасти снять нагрузку с работника и уменьшить время по отслеживанию нужной инфы;

— автоматизация процесса систематизации информационных сообщений СМИ дозволяет автоматом распределить поступающие в систему информационные сообщения зависимо от их типа и содержания по рубрикам.

Управление действиями в отделах по управлению информацией обязано производиться в режиме настоящего времени для наиболее удачного развития компании. Также нужны такие способности, чтоб система стремительно реагировала на возникающие конфигурации.

Одним из путей увеличения эффективности деятель отделов по управлению информацией является улучшение работы действий по формированию инфы. Потому принципиальное пространство занимает неувязка автоматизации работы консультанта ОТОИ, связанной с обработкой инфы и присвоение ей классифицирующих атрибутов.


1 ОБЗОР И анализ СУЩЕСТВУЮЩИХ СИСТЕМ КЛАССИФИКАЦИИ ИНФОРМАЦИИ

В истинное время задачка автоматического разнесения информационного потока по направленным на определенную тематику рубрикам является одной из важной в области обработки инфы в системах электрического документооборота. основное внимание при организации работ по управлению информацией сосредоточено на делему автоматизации действий систематизации информационных сообщений СМИ . Более животрепещущими являются задачки загрузки информационных сообщений в информационную базу, обработки текстовой и цифровой инфы, переход к структурированным сообщениям, оперативная корректировка структуры рубрикатора и словаря.

В истинное время в отделах документооборота началось активное внедрение программных товаров для автоматизации процесса систематизации.

Наибольшее распространение в отделах документооборота получили программные продукты: поисково-аналитическая система «Галактика-Зум», система «Термин-5», информационно-аналитическая система «Астарта», информационно-аналитическая система INLINETechnologies.

Любой из вариантов имеет свои достоинства и недочеты. Более всераспространенные забугорные системы отлично отлажены, но имеют еще наиболее высшую стоимость, недостаточно адаптированы к принятым в организациях технологиям, эталонам и форматам, что просит их суровой и дорогостоящей адаптации.

Отставание российских систем разъясняется в главном тем, что при отсутствии значимых денежных инвестиций русские системы употребляют в качестве базисного программного обеспечения бесплатные либо дешевенькие пакеты программ, которые не предусмотрены для сотворения сверхтехнологичных систем.

Беря во внимание сложившуюся ситуацию, целенаправлено выполнить анализ российских систем с целью доработки их до уровня полной конкурентоспособности.

Разглядим ряд автоматических систем по процессу систематизации инфы.

Поисково-аналитическая система «Галактика-Зум» создана для компаний и организаций, которым нужно заавтоматизировать процесс систематизации.

Программка предоставляет последующие способности:

— определение «информационного портрета» запрашиваемой темы, другими словами набор упорядоченных по значимости главных слов и словосочетаний, соответствующий конкретно для данной подборки;

— решение задачки ранжирования документов подборки по значимости – по большему соответствию инфопортрету подборки количества важных тем и их ранга в рассматриваемом документе;

— корректирование приобретенных инфопортретов;

— сопоставление инфопортрета документа с инфопортретами рубрик, с отсечение малохарактерных инфопортретов.

Информационно-аналитическая система «Астарта» создана для компаний и организаций, которым нужно заавтоматизировать и кардинальным образом повысить эффективность сбора, обработки и анализа неструктурированной инфы, получаемой из Веба, печатных материалов, СМИ и т.д. Программное решение базируется на технологии «Евфрат» и создано для сбора, обработки и анализа неструктурированной инфы, получаемой из Веба, печатных материалов СМИ и остальных источников.

К недочетам данных систем можно отнести последующее:

— неловкий для работы интерфейс;

— отсутствие довольно полного словаря для процесса систематизации информационных сообщений;

— отсутствие нужных для действенной работы функций формирования советов для принятия решений и отчетов.

Таковым образом, беря во внимание способности и недочеты имеющихся систем, нужно создать систему, которая предоставляла бы последующие способности:

— создание информационной базы для автоматического процесса систематизации статей по категориям рубрикатора;

загрузка информационных сообщений СМИ в информационную базу;

— обработка текстовой и цифровой инфы с внедрением способа нечеткого поиска;

— систематизация информационных сообщений с внедрением способа ранжирования;

— возможность оперативной корректировки структуры рубрикатора и словаря;

— формирование советов для принятия решений;

— формирование отчетов.


2 ОБЩЕСИСТЕМНЫЕ РЕШЕНИЯ

2.1 Объяснительная записка к техническому проекту

Полное наименование системы: автоматическая умственная система систематизации информационных сообщений средств массовой инфы (СМИ ). Условное обозначение: АИС «Классификатор».

заказчик: Управление информационных и аналитических технологий аппарата администрации Тульской области (УИАТ ТО), отдел технологий отображения инфы (ОТОИ).

Разраб: студентка Тульского муниципального института факультета экономики и права кафедры Автоматических информационных и управляющих систем группы 730211 Жиренкова Ира Юрьевна.

Плановые сроки начала и окончания работы по созданию системы:

— начало работ: 1 сентября 2006 года;

— окончание работ: 1 декабря 2006 года.

Разрабатываемая АИС «Классификатор» создана для обеспечения наиболее комфортной, действенной и высококачественной работы консультанта ОТОИ, связанной с обработкой инфы и присвоение ей классифицирующих атрибутов.

Целью сотворения системы является автоматизация процесса систематизации информационных сообщений СМИ . Система дозволит высвободить человека от необходимости рутинной работы по отслеживанию нужной инфы, принадлежащей к той либо другой рубрике, также уменьшить время на их обработку.

АИС «Классификатор» содержит в себе последующие подсистемы:

1) подсистема ведения информационной базы;

2) подсистема обработки информационных сообщений СМИ ;

3) подсистема опции характеристик;

4) подсистема систематизации информационных сообщений СМИ .

Подсистема ведения информационной базы обязана делать последующие функции:

1) формирование информационной базы;

2) добавление записи;

3) изменение записи;

4) удаление записи;

5) сохранение записи.

Подсистема обработки информационных сообщений СМИ обязана делать последующие функции:

1) открытие перечня текстовых файлов в каталоге;

2) открытие файла;

3) считывание строчки из файла;

4) запись информационных сообщений СМИ в базу;

5) закрытие файла.

Подсистема опции характеристик обязана делать последующие функции:

1) определение каталога с файлами;

2) настройка расширения файлов с начальными данными;

3) настройка характеристик систематизации.

Подсистема систематизации информационных сообщений СМИ обязана делать последующие функции:

1) поиск записей по разным ключам словаря при помощи способа нечеткого поиска;

2) систематизация сообщений по результатам поиска;

3) формирование советов для принятия решений;

4) формирование отчетов.

Информационное обеспечение скооперировано в согласовании с принципами развития, сопоставимости, стандартизации и унификации.

Входными данными являются:

— информационные сообщения СМИ ;

— характеристики систематизации;

— рубрикатор тем;

— словарь.

Выходными данными являются результаты систематизации информационных сообщений СМИ .

Выходными документами являются:

отчет по результатам систематизации;

отчет по обработанным сообщениям СМИ .

АИС «Классификатор» была разработана в среде программирования BorlandDelphi 7.0, главным инвентарем которого является ObjectPascal. На магнитных носителях сведения о сообщениях хранятся в виде базы, которая разработана в системе MSAccess. Сами информационные сообщения хранятся в файлах на твердом диске. Программное обеспечение реализовано при помощи модульного принципа и работает независимо от аппаратной части.

Для функционирования АИС «Классификатор» разработан комплекс технических средств, включающий в себя ПЭВМ на базе микропроцессора IntelCeleron с тактовой частотой 2 ГГц, клавиатуру, мышь, монитор SVGA, 2 Гбайт на твердом диске, 512 Мбайт оперативки (RAM), операционную систему WindowsMe, 2000, XP.

Для ввода системы в эксплуатацию нужна индивидуальная ЭВМ с набором устройств перифирии рабочего места. Также нужно провести ознакомление консультанта ОТОИ с принципами работы данной системы.


2.2 Описание схемы организационной структуры управления информационных и аналитических технологий аппарата администрации Тульской области

Управляет управлением информационных и аналитических технологий аппарата администрации Тульской области начальник управления. В конкретном руководстве у начальника находится заместитель начальника управления. У заместителя в руководстве определенное количество подразделений (отделов). Схема организационной структуры управления информационных и аналитических технологий приведена на рисунке 2.1.


ОТОИ производит свою деятельность в сфере управления действиями сотворения и внедрения передовых информационных технологий и в сфере управления вопросцами графической обработки и отображения инфы.

Главными задачками и функциями отдела являются:

— роль в подготовке управленческих решений (нормативно-правовых актов губернатора и администрации Тульской области) в сфере информатизации;

— роль в организации информационного взаимодействия федеральных и региональных органов власти, органов местного самоуправления методом отработки технологии производства и распространения информационных и информационно-правовых электрических и печатных бюллетеней и сборников;

— подготовка справочных, информационных и аналитических материалов в целях увеличения информированности и компетентности представителей органов власти;

— сбор и обработка инфы о деятельности органов исполнительной власти, аппарата администрации Тульской области, органов местного самоуправления региона в целях сотворения муниципальных информационных ресурсов;

— техническое, информационное, лингвистическое, организационное роль в наполнении веб-сайта (портала) администрации Тульской области, включая разработку веб-страниц;

— подготовка предложений по применению в органах исполнительной власти новейших технических средств и компьютерных технологий ввода, обработки и отображения графической, текстовой, гипертекстовой, аудио- и видеоинформации;

— подготовка информационных материалов для публикации в федеральных изданиях.

В целях организации информационного обмена меж структурными подразделениями областной администрации, государственными образованиями области и органами власти регионов экономического Центра Рф

осуществляется выпуск информационно-правового повторяющегося издания «Вестник администрации Тульской области», повторяющихся электрических бюллетеней «Опыт регионов» и «В Туле и области».

Подготовка этих материалов содержит в себе разработку темы и композиционной структуры всякого выпуска, стилистическое и техническое редактирование материалов.

Основополагающими принципами организации выпуска информационных материалов являются:

— соответствие задачкам, решаемым местными органами власти;

— оперативность и достоверность предоставляемой инфы;

— читабельность выпускаемых материалов (техно грамотность, доходчивость изложения, краткость).

нужно заавтоматизировать работу консультанта, который от Центра правительственной связи (ЦПС) по Тульской области часто получает большой массив инфы, основанный на публикациях СМИ разных регионов. Перед спецом департамента стоит задачка переработать его до читабельного размера и комфортной для юзеров формы.



Должностная инструкция консультанта
отдела технологий отображения инфы

1. Отлично организует служебную деятельность во связи с муниципальными органами и органами местного самоуправления Тульской области, муниципальными и государственными служащими Тульской области, организациями, гражданами.

2. Обладает современными средствами, способами и технологией работы с информацией и документами.

3. Обладает оргтехникой и средствами коммуникации.

4. Разрабатывает проекты законов и других нормативных правовых актов по направлению деятель.

5. Ведет служебный документооборот, исполняет служебные документы, подготавливает проекты ответов на воззвания организаций, людей.

6. Классифицирует и подготавливает аналитический, информационный материал, в том числе для средств массовой инфы.

7. Производит сбор, обработку и предоставление инфы о деятель региональных и городских органов власти области в виде информационных (электрических и печатных) бюллетеней, сборников, буклетов и т.д.

8. Подготавливает материалы для веб-сайта (портала) администрации Тульской области.

9. Описывает тему, сроки предоставления и дизайна аналитических и других материалов, размещаемых в официальном информационно-правовом издании «Вестник администрации Тульской области», электрических информационных бюллетенях и на веб-сайте администрации области.

2.3 Описание автоматизируемых функций и схемы многофункциональной структуры АИС «Классификатор»

Используя методологию IDEF0 при проектировании АИС «Классификатор» была получена ее многофункциональная модель.

Главной функцией системы (А0) является автоматизация процесса систематизации информационных сообщений СМИ . Для реализации данной функции нужно воплотить последующие функции:

А0 Заавтоматизировать процесс систематизации информационных сообщений СМИ

А1 Обработать информационные сообщения СМИ

А11 Открыть файл

А12 Считать информационные сообщения из файла

А13 Сформировать сообщения СМИ для занесения в информационную базу

А2 Вести информационную базу

А21 Сделать информационную базу

А22 Добавить запись

А23 Поменять запись

А24 Удалить запись

А25 Сохранить запись

А3 Настроить характеристики

А31 Найти каталог с файлами

А32 Задать расширение файлов

А33 Настроить характеристики систематизации

А4 Делать систематизацию информационных сообщений СМИ

А41 Отыскать запись по разным ключам словаря

А42 Систематизировать информационных сообщений СМИ

А43 Выдавать результаты систематизации

А5 Сформировывать отчеты

Дерево узлов, разработанной модели представлено на рисунке 2.2. Контекстная диаграмма А–0 и ее дочерние диаграммы представлены в приложении Б.



2.4 Описание постановки задачки

Целью сотворения системы является автоматизация процесса систематизации информационных сообщений СМИ . Комплекс задач, реализуемых разрабатываемой системой, должен обеспечивать комфортную, резвую и доброкачественную работу консультанта ОТОИ.

Главными задачками АИС «Классификатор» будут последующие:

— создание информационной базы для автоматического процесса систематизации статей к той либо другой группы;

загрузка информационных сообщений СМИ в базу;

— обработка текстовой и цифровой инфы с внедрением способа нечеткого поиска;

— систематизация информационных сообщений с внедрением способа ранжирования;

— открытость структуры рубрикатора и словаря, другими словами возможность оперативной их корректировки;

— формирование советов для принятия решений;

— формирование отчетов.

Входной информацией для реализации задач системы являются:

— информационные сообщения СМИ ;

— характеристики систематизации;

— рубрикатор тем;

— словарь.

Выходными данными являются результаты систематизации информационных сообщений СМИ .

Выходными документами являются:

отчет по результатам систематизации;

отчет по обработанным сообщениям СМИ .


3 ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ

3.1 Список входных данных

Для разработки АИС «Классификатор» употребляются последующие входные данные:

— информационные сообщения СМИ ;

— характеристики систематизации;

— рубрикатор тем;

— словарь.

3.2 Список выходных данных и документов

Выходными данными будут результаты систематизации информационных сообщений СМИ .

Выходными документами будут:

отчет по результатам систематизации;

отчет по обработанным сообщениям СМИ .

3.3 Описание информационного обеспечения АИС «Классификатор»

3.3.1 Описание структуры входных информационных сообщений и выходных данных и документов

Информационные сообщения СМИ подготавливаются в виде текстовых файлов.

Текстовые файлы формируются в формате MSDOS в шифровке ASCII.

Имя текстового файла состоит из собственного имени, занимающего 6 знакомест, и 3 знаков расширения. Порядок образования имени текстового файла имеет последующую структуру:

ГГЧЧММ.smi,

где ГГ — наименование городка, из которого пришло информационное сообщение (2 знакоместа);

ЧЧ — число месяца (2 знакоместа), за которое подготовлено информационное сообщение;

ММ — месяц, в каком подготовлено информационное сообщение;

smi– расширение информационного сообщения СМИ .

3.3.2 Описание структуры информационной части сообщения СМИ

Текстовый файл сформирован без разбиения на странички с сохранением уникальной структуры публикаций (абзацы, красноватые строчки и др.).

В состав текстового файла может заходить несколько информационных сообщений.

При формировании текстового файла с 1-ой позиции на отдельной строке без пропуска строк введена информационная часть сообщения.

Информационная часть сообщения имеет последующую структуру:

АО ХХХХХХХ

==/СМИ

01/ХХХХ

02/ДДММГГ

03/ХХХХХХХХ

04/ХХХХХХХХ

05/ХХ

06/главные слова и текст статьи

07/наименование статьи

08/создатель статьи

===

где АО ХХХХХХХ – адресок отправителя;

АО — большие буковкы российского алфавита;

ХХХХХХХ — семизначный код отправителя.

Меж знаками (АО) и кодом допускается один пробел.

==/ — признак начала информационной части (два знака «равно» и слеш — справа влево);

СМИ — принадлежность сообщения СМИ .

Каждое информационное сообщение отделяется сиим набором знаков.

Дальше заполняются атрибуты с 1-й позиции по 8-ю:

01/ — четырехзначный код источника инфы (код либо наименование газеты);

02/ — дата публикации в формате ДДММГГ;

03/ — шести- либо восьмизначный код региона;

04/ — наименование населенного пт (либо его 8-разрядный код), о котором пи­шется в статье газеты.

Атрибут заполняется большими знаками без указаний г., п., пгт. Под населенным пт предполагается город, село, но не район области, не район городка.

05/ — двузначный код отрасли, о которой идет речь в согласовании с классификатором отраслей. Если в статье газеты затрагивается нескольких отраслей, то код каждой из их дается отдельной строчкой с указателем — 05/;

06/ — главные слова и текст статьи.

1-ая строчка атрибута – главные слова по теме, отраженной в статье. Главные слова отделяются друг от друга точкой. к примеру:

бюджет. Задолженность.

Содержание статьи, отражающее существо затронутой задачи. Оно имеет неограниченную длину, но с учетом ограничений размера сообщений в сетях. Продолжение статьи во 2-ой и следующих строчках начинается с 4-й позиции, длина строчки обязана быть не наиболее 55 символов.

07/ — наименование статьи. Заносится в атрибут стопроцентно, как в оригинале статьи газеты;

08/ — создатель статьи.

Все значения атрибутов заносятся сходу же опосля слеша без пропуска пустых знакомест.

=== — признак окончания информационного сообщения (три знака «равно»).

Пример наполнения информационной части сообщения приведен в приложении В.

3.3.3 Главные требования, предъявляемые к подготовке сообщений СМИ в части орфографии

К подготовке информационных сообщений СМИ предъявляются последующие требования:

1. текст сообщения подготавливается в виде текстового файла.

2. информация в текстовом файле располагается в одну колонку и не форматируется.

3. Текстовый файл формируется без разбиения на странички с сохранением уникальной структуры публикаций (абзацы, красноватые строчки и др.).

4. информация в текстовый файл вводится строчными и строчными знаками как в статье газеты.

5. В текстовый файл вводятся наименование рубрики, подзаголовок (если они находятся) и текст статьи отдельными абзацами.

6. Абзацы, список пт и т.п. в тексте не отделяются «пустой» строчкой.

7. Российские слова текста не должны содержать букв латинского алфавита; римские числа — российских букв.

8. текст не должен содержать незаконченных предложений и обрывов в словах.

9. В текстовый файл не заносятся:

— маркетинговые вставки, фото, таблицы, графики, диаграммы и остальные графические материалы;

— заглавие городка, стоящее сначала либо в конце текста статьи, потому что оно заносится в атрибут 04/;

— спецсимволы, отсутствующие на клавиатуре ПЭВМ.

Если в конце текста статьи имеется ссылка на источник, из которого написан текст, то она заносится на первой строке перед текстом. к примеру:

По материалам русского радио.

10. Если к статье газеты дается инструкция либо комментарий, выделенные

остальным шрифтом, заключенные либо не заключенные в рамку, то они вводятся опосля текста статьи в обыкновенном шрифте без рамки, отделяя словами:

Комментарий (фамилия создателя).

11. Фамилия от инициалов отделяется пробелом.

12. слова текста, написанные в разрядку (через пробел) вводятся слитно. Главные слова в тексте должны быть полными без разрывов и сокращения.

13. Аббревиатуры вводятся без точек и разрядки.

14. Сокращения типа: т.д., т.п., с.г., т.г. вводятся без разрядки.

15. В числах меж цифрами не обязано быть пробелов.

16. Римские числа вводить на латинском регистре большенными знаками. к примеру: XXIV.

17. Спецсимволы, встречающиеся в математических формулах, должны быть изменены на буковкы российского либо латинского алфавита.

18. Хим элементы, единицы измерения, математические выражения и иная информация вводится в текстовый файл в согласовании с таблицей значений (приложение Г).

19. Примечание (сноска) вводится в текстовый файл с красноватой строчки опосля текста, отделяется чертой. К примеру:

_________________

(прим.2) — …

*) ….

20. Если в газете под одним наименованием несколько сообщений из различных регионов, то каждое сообщение оформляется отдельным текстовым файлом.

21. Если статья газеты имеет продолжение в последующем номере газеты, то ее текстовый файл готовится обыденным методом, а в конце текста с красноватой строчки вводится: «Продолжение в N ». Если статья является продолжением предшествующего номера газеты, то сначала текста вводится: «Начало в N ».

22. текст сообщения должен быть отредактирован. Все спецсимволы в

тексте должны быть изменены последующим образом:

— кавычки («») на кавычки (» «);

— номер (№) на номер (латинская буковка N);

— длинноватое тире (¾) на тире (-);

— буковка (ё) на буковку (е);

— апостроф (‘) на жесткий символ.

Соответствующими ошибками в текстовых файлах являются:

— орфографические ошибки в российских словах: пропуск букв(ы), лишняя(ие) буковка(ы), подмена букв(ы), латинская(ие) буковка(ы);

слова написаны слитно без пробела;

— в сложных словосочетаниях пропуск дефиса;

— опосля сокращения и символов препинания отсутствует пробел;

— пропуск точки в сокращении и в единицах измерения;

— заместо запятой стоит точка и напротив;

— заместо номера (латинской буковкы N) стоит иной знак.

Характеристики систематизации содержат в себе задание количества совпадений по наименованию статьи, по тексту статьи и по главным словам текста статьи. Тут же задается порог нечеткого поиска в процентах от 40 до 100. Чем выше процент, тем более четко поиск.

Рубрикатор тем представляет собой список рубрик на картонных носителях и имеет последующую структуру:

— рубрики 1-го уровня;

— рубрики 2-го уровня, раскрывающие сущность рубрик 1-го уровня;

— рубрики 3-го уровня, раскрывающие сущность рубрик 2-го уровня;

— рубрики 4-го уровня, раскрывающие сущность рубрик 3-го уровня.

Рубрикам 3-го и 4-го уровней соответствуют свои словари, представляющие из себя список главных слов. Рубрикатор тем и словарь приведены в приложении Д.

Результаты систематизации информационных сообщений СМИ содержат код рубрики, наименование рубрики, количество совпадений по наименованию, тексту, главным словам статьи, и окончательный итог

систематизации.

отчет по результатам систематизации содержит данные по каждой статье: дату, избранный файл, заглавие статьи, главные слова статьи, создателя, текст статьи, количество совпадений по наименованию, тексту и главным словам статьи.

отчет по обработанным сообщениям СМИ содержит результаты систематизации по любому файлу и включает: дату, заглавие статьи, главные слова статьи, создателя, текст статьи и сопоставленные рубрики.

структура выходных данных и документов представлена в приложении Е.

3.4 Описание организации информационной базы

3.4.1 Описание организации внутримашинной базы

Все сведения о сообщениях СМИ хранятся в базе данных, которая состоит из последующих таблиц:

— статьи;

газета;

— регион;

— ветвь;

— справочник отраслей;

— рубрики;

систематизация;

— рубрикатор 1;

— рубрикатор 2;

— рубрикатор 3;

— рубрикатор 4;

— словарь рубрикатора 3;

— словарь рубрикатора 4.

Их описание представлено в таблицах 3.1 – 3.13 соответственно.

Таблица 3.1 – Таблица «Статьи»


Первичный ключ
Атрибуты
Тип данных
Описание

Код газеты
Числовой
Длина 2 знака

Код региона
Числовой
Длина 8 знаков

Код статьи
Счетчик
Последовательное слова
Текстовый
Длина 255 знаков

текст
Поле MEMO

Дата
Дата/время
Лаконичный формат даты

Создатель
Текстовый
Длина 150 знаков

файл
Текстовый
Длина 255 знаков

Классифицировано
Логический
правда/ересь

Таблица 3.2 – Таблица «Газета»


Первичный ключ
Атрибуты
Тип данных
Описание

Неповторимый ключ
Код газеты
Числовой
Длина 2 знака

Наименование
Текстовый
Длина 150 знаков

Таблица 3.3 – Таблица «Регион»


Первичный ключ
Атрибуты
Тип данных
Описание

Неповторимый ключ
Код региона
Числовой
Длина 8 знаков

Наименование региона
Текстовый
Длина 150 знаков

Таблица 3.4 – Таблица «Ветвь»


Первичный ключ
Атрибуты
Тип данных
Описание

Составной ключ
Код статьи
Числовой
Длинноватое целое

Код отрасли
Числовой
Длинноватое целое

Таблица 3.5 – Таблица «Справочник отраслей»


Первичный ключ
Атрибуты
Тип данных
Описание

Неповторимый ключ
Код отрасли
Числовой
Длинноватое целое

Наименование
Текстовый
Длина 150 знаков

Таблица 3.6 – Таблица «Рубрики»


Первичный ключ
Атрибуты
Тип данных
Описание

Составной ключ
Код рубрики
Числовой
Длинноватое целое

Код статьи
Числовой
Длинноватое целое

Уровень рубрики
Числовой
Длинноватое целое

Таблица 3.7 – Таблица «Систематизация»


Первичный ключ
Атрибуты
Тип данных
Описание

Неповторимый ключ
Код статьи
Числовой
Длинноватое целое

Код рубрики
Числовой
Длинноватое целое

Уровень рубрики
Числовой
Длинноватое целое

По наименованию статьи
Числовой
Длинноватое целое

По главным словам
Числовой
Длинноватое целое

По тексту статьи
Числовой
Длинноватое целое

Итог
Текстовый
Длина 50 знаков

Таблица 3.8 – Таблица «Рубрикатор 1»


Первичный ключ
Атрибуты
Тип данных
Описание

Неповторимый ключ
Код_1
Счетчик
Последовательное Таблица 3.9 – Таблица «Рубрикатор 2»
Первичный ключ
Атрибуты
Тип данных
Описание

Неповторимый ключ
Код_2
Счетчик
Последовательное Таблица 3.10 – Таблица «Рубрикатор 3»
Первичный ключ
Атрибуты
Тип данных
Описание

Неповторимый ключ
Код_3
Счетчик
Последовательное Таблица 3.11 – Таблица «Рубрикатор 4»
Первичный ключ
Атрибуты
Тип данных
Описание

Неповторимый ключ
Код_4
Счетчик
Последовательное Таблица 3.12 – Таблица «Словарь рубрикатора 3»
Первичный ключ
Атрибуты
Тип данных
Описание

Неповторимый ключ
Код_3
Числовой
Длинноватое целое

слова
Текстовый
Длина 255 знаков

Таблица 3.13 – Таблица «Словарь рубрикатора 4»


Первичный ключ
Атрибуты
Тип данных
Описание

Неповторимый ключ
Код_4
Числовой
Длинноватое целое

слова
Текстовый
Длина 255 знаков

Данные таблицы объединены в инфологическую модель, схема которой представлена на рисунке 3.4.1.


Набросок 3.4.1 – Инфологическая модель базы

Иерархия наполнения таблиц базы представлена на рисунке 3.4.2.

Набросок 3.4.2 – Иерархия наполнения таблиц базы


4 МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ

4.1 Математическая постановка задачки систематизации информационных
сообщений СМИ

Пусть дано огромное количество статей Х, огромное количество главных слов статьи W и огромное количество заглавий статей A. Каждое огромное количество описывается своим набором частей:

X = {x1
, x2
, …, xc
},

где xi
– i- я статья;

c – количество статей;

W = {w1
, w2
, …, wc
},

где wi
– строчка главных слов i-ой статьи, ;

A = {a1
, a2
, … ac
},

где ai
– заглавие i-ой статьи, .

Имеется рубрикатор, состоящий из 4 уровней:

R1
= {r11
, r12
, … r1
k
},

где k – количество частей рубрикатора 1;

R2
= {r21
, r22
, … r2
l
},

где l – количество частей рубрикатора 2;

R3
= {r31
, r32
, … r3
m
},

где m – количество частей рубрикатора 3;

R4
= {r41
, r42
, … r4
n
},

где n – количество частей рубрикатора 4.

К любому элементу рубрикаторов 3-го и 4-го уровней привязаны словари со своими огромными количествами:

D3
j
= {d31
j
, d32
j
, … d3
y
j
}, ;

D4
j
= {d41
j
, d42
j
, … d4
z
j
}, ,

где j – индекс элемента рубрики;

y, z – количество частей в словаре для определенной рубрики.

Функция нечеткого поиска задается последующим образом:

тут U = {{X},{W},{A}};

dpq
j
– ключевое слово,

где j – индекс элемента рубрики, либо ;

p – уровень рубрикатора 3-й либо 4-й;

q – индекс частей в словарях D3
j
и D4
j
;

либо ;

pн.п
– порог нечеткого поиска.

Дальше для каждой статьи применяем функцию нечеткого поиска:

где — общее количество совпадений по i-ой статье из словаря 3-го и 4-го уровней;

;

.

Потом для главных слов статьи также применяем функцию нечеткого поиска:

где общее количество совпадений по строке главных слов i-ой статьи из словаря 3-го и 4-го уровней;

;

.

Для заглавий статей тоже применяем функцию нечеткого поиска:

где — общее количество совпадений по наименованию i-ой статьи из словаря 3-го и 4-го уровней;


;

.

Дальше для отнесения каждой статьи к той либо другой рубрике употребляется способ ранжирования. Для этого определяются границы 3-х интервалов:

1) статью совершенно точно недозволено отнести к рубрике;

2) эксперт ОТОИ воспринимает решение о принадлежности статьи к данной рубрике;

3) статья с данной вероятностью относится к данной рубрике.

Границей является количество слов, которые должны повстречаться в тексте, заглавии статьи либо в перечне главных слов, относящихся к данной статье.

способ ранжирования заключается в последующем:

где границы интервалов по тексту i-ой статьи;

границы интервалов по строке главных слов i-ой статьи;

границы интервалов по наименованию i-ой статьи.




4.2 Описание способа нечеткого поиска

Для нечеткого поиска инфы употребляется метод, основанный на процентном отношении совпадения 2-ух строк. процесс поиска начинается со сопоставления всякого элемента одной строчки с каждым элементом иной и завершается сопоставлением строк полностью. Эта процедура повторяется два раза для одной и той же пары строк. В первом случае 1-ая строчка принимается за идеал, во 2-м – 2-ая. В процессе сопоставления подсчитывается число совпадений и общее число рассматриваемых случаев, опосля чего же рассчитывается их процентное соотношение. На базе этого соотношения принимается решение – считать найденную информацию удовлетворяющей условиям поиска либо нет. Описанная процедура применяется ко всем записям информационной базы, в итоге юзер получает всю информацию, удовлетворяющую запросу.

Изменяя малый процент совпадения можно уменьшать либо наращивать точность соответствия отысканной инфы разыскиваемой. В данной системе употребляется 50% совпадения, потому что (из практики) этого довольно для нахождения инфы. Схема программки поиска данных по методу нечеткого поиска приведена на рисунке 4.2.1, схема программки сопоставления строк приведена на рисунке 4.2.2.


Набросок 4.2.1 — Схема программки поиска данных по методу нечеткого поиска


Набросок 4.2.2 — Схема программки сопоставления строк «Matching»


4.3 Описание запросов

Для данной работы нужно сделать последующие запросы: «Рубрикатор», «Систематизация 3-го уровня», «Систематизация 4-го уровня», «Классифицированные сообщения», «Обработанные сообщения 3-го уровня», «Обработанные сообщения 4-го уровня».

запрос «Рубрикатор» нужен для вывода всей инфы по всем уровням рубрикатора и словарям 3-го и 4-го уровней. структура запроса «Рубрикатор» в режиме SQL:

SELECTРубрикатор_1.Индекс_1,Рубрикатор_2.Индекс_2,Рубрикатор_3.Индекс_3, IIf(IsNull([Индекс_4]),0,[Индекс_4])ASИндекс_4,Trim(Str([Рубрикатор_1].[Индекс_1]))+».»+Trim(Str([Рубрикатор_2]

[Индекс_2]))+».»+Trim(Str([Рубрикатор_3].[Индекс_3]))+».»+Trim(Str(IIf(IsNull([Индекс_4]),0,[Индекс_4])))+».»AS Индекс, Рубрикатор_1.Наименование_1,Рубрикатор_2.Наименование_2,Рубрикатор_3.Наименование_3, Рубрикатор_4. Наименование_4, Рубрикатор_1.Код_1, Рубрикатор_2.Код_2, Рубрикатор_3.Код_3, Рубрикатор

_4.Код_4

FROM ((Рубрикатор_1 LEFTJOIN Рубрикатор_2 ON Рубрикатор_1.Код_1= Рубрикатор_2.Код_1) LEFTJOIN Рубрикатор_3 ON Рубрикатор_2.Код_2 = Рубрикатор_3.Код_2) LEFTJOIN Рубрикатор_4 ON Рубрикатор_3.

Код_3 = Рубрикатор_4.Код_3

ORDERBY Рубрикатор_1.Индекс_1,Рубрикатор_2.Индекс_2,Рубрикатор_3.Индекс_3, IIf(IsNull ([Индекс_4]), 0,[Индекс_4]);

запрос «Систематизация 3-го уровня» нужен для вывода инфы по результатам систематизации по 3-му уровню рубрикатора. структура запроса «Систематизация 3-го уровня» в режиме SQL:

SELECTTrim(Str([Рубрикатор_1].[Индекс_1]))+».»+Trim(Str([Рубрикатор_2].[Индекс_2]))+».»+Trim(Str([Рубрикатор_

3].[Индекс_3]))+».»ASИндекс,[Рубрикатор_1].[Наименование_1]+».»+[Рубрикатор_2].[Наименование_2]+».»+[Рубрикатор_3].[Наименование_3]ASНаименованиерубрики,[систематизация].[Уровеньрубрики], [классификация].

[Наименование статьи], [систематизация].[Текст статьи], [классификация].[Главные слова], [Классификация]. [Результат], [систематизация].[Код статьи], [Рубрикатор_3].[Код_3] AS Код статьи

FROM (Рубрикатор_1 INNERJOIN Рубрикатор_2 ON [Рубрикатор_1].[Код_1]=[Рубрикатор_2].[Код_1]) INNERJOIN (Рубрикатор_3 INNERJOIN систематизация ON [Рубрикатор_3].[Код_3]=[классификация].[Код рубрики]) ON [Рубрикатор_2].[Код_2]=[Рубрикатор_3].[Код_2]

WHERE ((([систематизация].[Уровень рубрики])=3));

запрос «Систематизация 4-го уровня» нужен для вывода инфы по результатам систематизации по 4-му уровню рубрикатора. структура запроса «Систематизация 4-го уровня» в режиме SQL:

SELECTTrim(Str(Рубрикатор_1.Индекс_1))+».»+Trim(Str(Рубрикатор_2.Индекс_2))+».»+Trim(Str(Рубрикатор_3.

Индекс_3))+».»+Trim(Str(Рубрикатор_4.Индекс_4))+».»ASИндекс,Рубрикатор_1.Наименование_1+». «+Рубрикатор

_2.Наименование_2+». «+Рубрикатор_3.Наименование_3+».»+Рубрикатор_4.Наименование_4 AS Наименование рубрики, систематизация.Уровень рубрики, Систематизация.Наименование статьи, систематизация.текст статьи, Систематизация.Главные слова, систематизация.Итог, Систематизация.Код рубрики, Рубрикатор_4.Код_4 AS Код статьи FROM ((Рубрикатор_1 INNERJOIN Рубрикатор_2 ON Рубрикатор_1.Код_1=Рубрикатор_2.Код_1) INNERJOIN Рубрикатор_3 ON Рубрикатор_2.Код_2=Рубрикатор_3.Код_2) INNERJOIN (Рубрикатор_4 INNERJOIN систематизация ON Рубрикатор_4.Код_4=Систематизация.Код рубрики) ON Рубрикатор_3.Код_3=

Рубрикатор_4.Код_3 WHERE (((систематизация.Уровень рубрики)=4));

запрос «Классифицированные сообщения» нужен для сотворения отчета по результатам систематизации. структура запроса«Обработанные сообщения» в режиме SQL:

SELECTDISTINCT Статьи.Код статьи

FROM Статьи INNERJOIN Рубрики ON Статьи.Код статьи = Рубрики.Код рубрики;

запрос «Обработанные сообщения 3-го уровня» нужен для вывода инфы по обработанным сообщениям СМИ , отнесенным к 3-му уровню рубрикатора. структура запроса«Обработанные сообщения 3-го уровня» в режиме SQL:

SELECTTrim(Str(Рубрикатор_1.Индекс_1))+».»+Trim(Str(Рубрикатор_2.Индекс_2))+».»+Trim(Str(Рубрикатор_3

.Индекс_3))+».» AS Индекс, Статьи.файл, Статьи.Код газеты, Статьи.Код региона, Статьи.Код статьи, Статьи.Наименование статьи, Статьи.Главные слова, Статьи.Текст статьи, Статьи.Дата, Статьи.создатель, Статьи.Код рубрики, Статьи.Уровень рубрики, Рубрикатор_1.Наименование_1+».»+Рубрикатор_2.Наименование

_2+». «+Рубрикатор_3. Наименование_3 AS Наименование рубрики

FROM (Рубрикатор_1 INNERJOIN Рубрикатор_2 ON Рубрикатор_1.Код_1 = Рубрикатор_2.Код_1) INNERJOIN (Рубрикатор_3 INNERJOIN Стать ON Рубрикатор_3.Код_3 = Статьи.Код рубрики) ON Рубрикатор_2.Код_2 = Рубрикатор_3.Код_2

WHERE (((Статьи.Уровень рубрики)=3));

запрос «Обработанные сообщения 4-го уровня» нужен для вывода инфы по обработанным сообщениям СМИ , отнесенным к 4-му уровню рубрикатора. структура запроса «Обработанные сообщения 4-го уровня» в режиме SQL:

SELECTTrim(Str(Рубрикатор_1.Индекс_1))+».»+Trim(Str(Рубрикатор_2.Индекс_2))+».»+Trim(Str(Рубрикатор_3.

Индекс_3))+».»+Trim(Str(Рубрикатор_4.Индекс_4))+».» AS Индекс, Статьи.файл, Статьи.Код газеты, Статьи.Код региона, Статьи.Код рубрики, Статьи.Наименование статьи, Статьи.Главные слова, Статьи.Текст статьи, Статьи.Дата, Статьи.создатель, Статьи.Код рубрики, Статьи.Уровень рубрики, Рубрикатор_1.Наименование_1+». «+Рубрикатор_2.Наименование_2+». «+Рубрикатор_3.Наименование_3+».»+Рубрикатор_4.Наименование_4 AS Наименование рубрики

FROM ((Рубрикатор_1 INNERJOIN Рубрикатор_2 ON Рубрикатор_1.Код_1=Рубрикатор_2.Код_1) INNERJOIN Рубрикатор_3 ON Рубрикатор_2.Код_2=Рубрикатор_3.Код_2) INNERJOIN (Рубрикатор_4 INNERJOIN Статьи ON Рубрикатор_4.Код_4=Статьи.Код рубрики) ON Рубрикатор_3.Код_3=Рубрикатор_4.Код_3

WHERE (((Статьи.Уровень рубрики)=4));

4.4 Описание схемы работы системы

Схема работы системы представляет собой последовательность шагов, которую нужно выполнить для систематизации информационных сообщений СМИ .

работу нужно начать с загрузки информационных сообщений СМИ

в базу системы, на базе которых будет проводиться систематизация. Для загрузки сообщений определяется положение каталога с файлами с заданием расширения с начальными информационными сообщениями.

При переходе ко второму шагу нужно настроить характеристики систематизации, которые заключаются в определении количества совпадений по наименованию статьи, по тексту статьи, по главным словам статьи. Также нужно задать порог нечеткого поиска.

На шаге систематизации сначала производится поиск записей по разным ключам словаря при помощи метода нечеткого поиска. Дальше производится систематизация информационных сообщений СМИ при помощи способа ранжирования, заключающегося в автоматическом распределении поступающих в систему информационных сообщений СМИ зависимо от их типа и содержания по рубрикам. Результаты систематизации выводятся на экран.

По результатам систематизации формируются советы для принятия решений и отчеты. Отчеты сохраняются в текстовом файле формата doc.

При выбирании оканчивающего режима работы системы произойдет выход из нее.

Схема работы системы представлена на рисунке 4.4.1.

Текст программки представлен в приложении Е.


Набросок 4.4.1 – Схема работы системы


5 ТЕХНИЧЕСКОЕ ОБЕСПЕЧЕНИЕ АИС «КЛАССИФИКАТОР»


5.1 Описание комплекса технических средств

АИС «Классификатор» реализована на базе ПЭВМ. ПЭВМ дозволяет значительно повысить эффективность работы юзера строительными и техническими способностями. Принято решение применять базисный набор ПЭВМ типа IBM PC, технические свойства которого разрешают решать все поставленные задачки.

При проектировании и функционировании системы употребляется базисный набор ПЭВМ IBM PC, включающий последующие устройства:

машина — комплекс технических средств, предназначенных для автоматической обработки информации в процессе решения вычислительных и информационных задач) (либо вычислительной системы) которое делает арифметические и логические операции данные программкой преобразования инфы управляет вычислительным действием и коор IntelSeleron с тактовой частотой 2 ГГц;

— 256 Мбайт оперативки;

— твердый диск не наименее 2 Гбайт;

— операционная система – WindowsMe, 2000, XP;

монитор SVGA;

— клавиатура обычная русифицированная;

— мышь.

При эксплуатации оборудования юзеры должны управляться последующими документами:

инструкция по технике сохранности;

— управление юзера.

нужно соблюдать требования техники сохранности и последующие меры предосторожности:

1) не подключать и не отключать соединители электропитания при поданном напряжении в сеть;

2) не оставлять ЭВМ включенной без наблюдающего;

3) по окончанию работ отключать ПЭВМ от сети.



5.2 инструкция по эксплуатации комплекса технических средств

Данная инструкция дает юзеру нужное указание по использованию базисного набора ПЭВМ IBM PC. К работе с ЭВМ допускаются лица, прошедшие инструктаж по технике сохранности при работе с электроустановками напряжением до 1000 В.

При эксплуатации ПЭВМ запрещается:

1) использовать комплектующие изделия, носители данных и материалы, не обозначенные в эксплуатационной документации;

2) подключать устройства, внедрение которых не согласовано с изготовителем ПЭВМ;

3) извлекать электрические модули, отсоединять кабель интерфейса при присоединенном электропитании хоть какой из составных частей ПЭВМ;

4) снимать кожухи устройства, проводить какие-либо ремонтные работы.

Категорически запрещается работать на ПЭВМ при снятом кожухе хоть какого из устройств. До включения электропитания ПЭВМ нужно проверить зрительно целостность соединительных кабелей.

К эксплуатации оборудования допускаются лица, работающие с АИС «Классификатор», которые могут не являться спецами в области компьютерных технологий и программирования, а владеют только способностями работы с компом.

Решение задач осуществляется ПЭВМ под управлением операционной системы (ОС) Windows Me, 2000, XP. Подготовка к работе заключается в исходной загрузке в ОЗУ ПЭВМ ОС Windows. Исходная загрузка OC Windows производится автоматом в последующих вариантах:

1) при включении электропитания компа;

2) при нажатии на кнопку RESET, которая находится на фронтальной панели корпуса ПЭВМ;

3) при перезагрузке компа.

Чтоб выполнить загрузку системы, нужны последующие деяния:

1) включить стабилизатор напряжения (если нужно);

2) включить (если нужно) принтер;

3) включить монитор компа;

4) включить выключатель на корпусе системного блока.

Опосля этого на дисплее покажется сообщение о ходе работы программ проверки и исходной загрузки компа. Когда исходная загрузка будет закончена, на дисплее монитора покажется изображение десктопа.

Опосля удачного окончания исходной загрузки можно перейти к решению задач юзера.

При окончании работы программки нужно:

1) окончить работу программ;

2) выключить принтер, если он включен;

3) выключить монитор компа, если нужно;

4) выключить комп;

5) выключить стабилизатор напряжения.


ЗАКЛЮЧЕНИЕ

Во время выполнения дипломной работы был изготовлен обзор и проведен анализ неких имеющихся разработок в сфере электрического документооборота, направленных на автоматизацию процесса систематизации информационных сообщений, указаны их способности и недочеты. С учетом нужных требований были определены способности, которыми обязана владеть АИС «Классификатор»:

— создание информационной базы для автоматического процесса систематизации статей к той либо другой группы;

загрузка информационных сообщений СМИ в базу;

— обработка текстовой и цифровой инфы с внедрением способа нечеткого поиска;

— систематизация информационных сообщений с внедрением способа ранжирования;

— открытость структуры рубрикатора и словаря, другими словами возможность оперативной их корректировки;

— формирование советов для принятия решений;

— формирование отчетов.

Были сформулированы предназначение и цели системы, поставлены задачки и определены функции.

Была разработана форма и представлено подробное описание структуры входных информационных сообщений СМИ и результатов систематизации, применяемых и получаемых в итоге функционирования АИС «Классификатор». Была разработана структура организации базы для хранения информационных сообщений СМИ .

Была разработана математическая постановка задачки систематизации информационных сообщений СМИ , также описаны способ нечеткого поиска и способ ранжирования, используемые при реализации требуемых многофункциональных черт АИС «Классификатор», была разработана схема работы системы.

Была рассчитана надежность системы на всех шагах ее развития.

Результатом проделанной работы является программка, выполняющая последующие функции:

— ведение информационной базы: формирование, добавление записи, изменение записи, удаление записи, сохранение записи, согласованное с работой всего объекта автоматизации;

— обработка информационных сообщений СМИ : открытие перечня текстовых файлов в каталоге, открытие файла, считывание строчки из файла, запись информационных сообщений СМИ в базу, закрытие файла;

— настройка характеристик: определение каталога с файлами, задание расширения файлов с начальными данными, настройка расширения файлов, настройка характеристик систематизации;

— открытость структуры рубрикатора и словаря, другими словами возможность оперативной их корректировки;

систематизация информационных сообщений СМИ : поиск записей по разным ключам словаря при помощи способа нечеткого поиска, систематизация сообщений по результатам поиска, формирование советов для принятия решений, формирование отчетов.

При выполнении дипломного проекта особенное внимание было уделено информационным чертам решаемой задачки, проведен анализ инфы, поступающей в систему для обработки, учтены все требования, предъявляемые к решению поставленной задачки. Также был рассчитан экономический эффект от внедрения разработки, рассмотрены вопросцы охраны труда.


БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. ГОСТ 2.105-95. ЕСКД. Общие требования к текстовым документам.

2. ГОСТ Р50.1.028-2001. Методология многофункционального моделирования.

3. ГОСТ 28195-89. Оценка свойства программных средств.

4. ГОСТ 19.102-77.ЕСПД. Стадии разработки.

5. ГОСТ 19.402-78.ЕСПД. Описание программки.

6. ГОСТ 12.1.005-88 Общие санитарно-гигиенические требования к воздуху в рабочей зоне.

7. ГОСТ 19.701-90 Схемы алгоритмов, программ, данных и систем.

8. ГОСТ 34.201-89 Информационная разработка. Виды, комплектность и обозначение документов при разработке автоматических систем.

9. ГОСТ 34.602-89 Информационная разработка. Техническое задание на создание автоматической системы.

10. СанПиН 2.2.2/2.4.1340-03 Гигиенические требования к индивидуальным электронно-вычислительным машинкам и организации работы.

11. Р.2.2.2006-05 Гигиенические аспекты оценки критерий труда по показателям вредности и угрозы окружающей среды, тяжести и напряженности трудового процесса.

12. СанПиН 2.2.548-96 Общие санитарно-гигиенические требования к воздуху в рабочей зоне.

13. Андрейчиков А.В., Андрейчикова О.Н. Умственные информационные системы: Учебник. – М.: Деньги и статистика, 2004. – 424 с.: ил.

14. Базы данных в Delphi 7. Самоучитель/ В. Понамарев. – СПб.: Питер, 2003. – 224 с.: ил.

15. Башмаков А.И., Башмаков И.А. Умственные информационные технологии: Учеб. пособие. – М.: Изд-во МГТУ им. Н.Э. Баумана, 2005. – 304 с.: ил.

16. Бобровский С.И. Delphi 7. Учебный курс.– СПб.: Питер, 2003. – 736с.

17. Глушаков С.В., Клевцов А.Л. Программирование в среде Delphi 7. – Харьков: Фолио, 2003. – 528с.

18. Гофман В.Э., Хомоненко А.Д. Работа с базами данных в Delphi / В. — 2-е изд. – СПб.: БХВ – Петербург, 2002. – 624с.: ил.

19. Девятков В.В. системы искусственного ума: Учеб. пособие для вузов. – М.: Изд-во МГТУ им. Н.Э. Баумана, 2001. – 352 с.: ил.

20. Диго С.М. Проектирование баз данных: Учебник. – М.: деньги и статистика, 1988. – 216с.

21. Дубнов П.Ю. Access 2000: Программирование баз данных. – М.: ДМК, 2000. – 272с.: ил.

22. Пономарев В. Базы данных в Delphi 7: Самоучитель. – М. и др.: Питер, 2003. – 224с.: ил.

23. средства защиты в машиностроении: Расчет и проектирование: Справочник/С.В. Белов, А.Ф. Козьяков, О.Ф. Партолин и др.; Под ред. С.В. Белова. – М.: Машиностроение, 1989. – 368 с.: ил.

24. Типовые нормы времени на программирование задач для ЭВМ . – М.: Экономика, 1989.

25. http://гугл.ru/com/str.zip

26. http://гугл.ru//narod.ru/Hem/infon.zip


приложение 1. Структура входных и выходных документов

Результаты систематизации информационных сообщений СМИ


Код
Наименование рубрики
Заглавие
текст
Главные слова
Итог

Отчет по результатам систематизации статьи

Дата публикации:_________________

файл публикации:________________

Заглавие публикации:_____________

Главные слова:__________________

Создатель публикации: ________________

текст публикации: _______________


Код
Наименование
По наименованию
По тексту
По главным словам

Итог




отчет по обработанным статьям файла

Дата публикации: ____________________

Заглавие публикации: ________________

Главные слова: _____________________

Создатель публикации: ___________________

Текст публикации: ___________________

Сопоставленные рубрики: _______________


приложение 2. Текст программки

unituMain;

interface

uses

Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,

Dialogs, Menus, OleServer, WordXP;

type

TfrmMain = class(TForm)

mnMain: TMainMenu;

N1: TMenuItem;

N2: TMenuItem;

N3: TMenuItem;

N4: TMenuItem;

N5: TMenuItem;

N6: TMenuItem;

N7: TMenuItem;

N8: TMenuItem;

N9: TMenuItem;

N10: TMenuItem;

N11: TMenuItem;

wa: TWordApplication;

wd: TWordDocument;

wf: TWordFont;

N12: TMenuItem;

procedure N2Click(Sender: TObject);

procedure N3Click(Sender: TObject);

procedure N5Click(Sender: TObject);

procedure N7Click(Sender: TObject);

procedure N9Click(Sender: TObject);

procedure N11Click(Sender: TObject);

procedure N12Click(Sender: TObject);

private

{ Private declarations }

public

{ Public declarations }

end;

var

frmMain: TfrmMain;

implementation

uses uInputModule, uClassify, uEditDictModule, uClassifySettings,

uDataModule, uGetFileName, uEditPubl;

{$R *.dfm}

procedure TfrmMain.N2Click(Sender: TObject);

begin

frmInputForm.ShowModal;

end;

procedure TfrmMain.N3Click(Sender: TObject);

begin

frmClassify.ShowModal;

end;

procedure TfrmMain.N5Click(Sender: TObject);

begin

frmEditDict.ShowModal;

end;

procedure TfrmMain.N7Click(Sender: TObject);

begin

frmClassifySettings.ShowModal;

end;

procedure TfrmMain.N9Click(Sender: TObject);

begin

Close;

end;

procedure TfrmMain.N11Click(Sender: TObject);

var tmpl, Template, NewTemplate, ItemIndex: olevariant;

ARange: Range;

pars: Paragraphs;

par: Paragraph;

st: string;

vcol: OleVariant;

iStat: integer;

begin

dmIAS.aqFiles.Close;

dmIAS.aqFiles.Open;

frmGetFileName.cbFiles.Items.Clear;

frmGetFileName.cbFiles.Text:= dmIAS.aqFiles.FieldByName(‘file’).AsString;

while not dmIAS.aqFiles.Eof do

begin

frmGetFileName.cbFiles.Items.Add(dmIAS.aqFiles.FieldByName(‘file’).AsString);

dmIAS.aqFiles.Next;

end;

frmGetFileName.iMD:= 0;

frmGetFileName.ShowModal;

if (frmGetFileName.iMD = 0) or (frmGetFileName.cbFiles.Text = »)

then exit;

dmIAS.aqExe.Close;

dmIAS.aqExe.SQL.Text:= ‘Select * from qObrPubl where file = :file’;

dmIAS.aqExe.Parameters.ParamByName(‘file’).Value:= frmGetFileName.cbFiles.Text;

dmIAS.aqExe.Open;

try

wa.Connect;

wa.Visible := True;

except

MessageDlg(‘АуВас Word неустановлен :(‘, mtError, [mbOk], 0);

Abort;

end;

ItemIndex:= 1;

Template:= EmptyParam;

NewTemplate := False;

// Созданиедокумента

wa.Documents.Add(Template, NewTemplate, EmptyParam, EmptyParam) ;

wd.ConnectTo(wa.Documents.Item(ItemIndex));

wd.PageSetup.Set_Orientation(wdOrientLandscape);

wa.Options.CheckSpellingAsYouType := False;

wa.Options.CheckGrammarAsYouType := False;

ARange:= wd.Range(EmptyParam, EmptyParam);

pars:= wd.Paragraphs;

tmpl:= ARange;

par:= pars.Add(tmpl);

wf.ConnectTo(wd.Sentences.Get_Last.Font);

wd.Range.Paragraphs.Set_Alignment(wdAlignParagraphLeft);

wa.Selection.Font.Bold:= 1;

wa.Selection.Font.Size:= 16;

st:= ‘Отчетпообработаннымстатьямфайла ‘ + frmGetFileName.cbFiles.Text;

wa.Selection.InsertAfter(st+#13);

wa.Selection.InsertAfter(‘ ‘+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

iStat:= -1;

while not dmIAS.aqExe.Eof do

begin

if iStat <> dmIAS.aqExe.FieldByName(‘id_publ’).AsInteger

then

begin

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

wa.Selection.Font.Bold:= 0;

wa.Selection.Font.Size:= 14;

wa.Selection.InsertAfter(‘ ‘+#13);

wa.Selection.InsertAfter(‘ ‘+#13);

st:= ‘Датапубликации: ‘;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

if (dmIAS.aqExe.FieldByName(‘data’).AsString = ‘30.12.1899’)

then st:= ‘ ‘

else st:= dmIAS.aqExe.FieldByName(‘data’).AsString;

wa.Selection.InsertAfter(st+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= ‘Названиепубликации: ‘;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= dmIAS.aqExe.FieldByName(‘name_publ’).AsString;

wa.Selection.InsertAfter(st+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= ‘Ключевыеслова: ‘;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= dmIAS.aqExe.FieldByName(‘keywords’).AsString;

wa.Selection.InsertAfter(st+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= ‘Авторпубликации: ‘;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= dmIAS.aqExe.FieldByName(‘author’).AsString;

wa.Selection.InsertAfter(st+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= ‘Текстпубликации: ‘;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= dmIAS.aqExe.FieldByName(‘text_publ’).AsString;

wa.Selection.InsertAfter(st+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= ‘Сопоставленныерубрики:’;

wa.Selection.InsertAfter(st+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= dmIAS.aqExe.FieldByName(‘indx’).AsString

+ ‘ ‘

+ dmIAS.aqExe.FieldByName(‘name_r’).AsString;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

iStat:= dmIAS.aqExe.FieldByName(‘id_publ’).AsInteger;

end

else

begin

wa.Selection.InsertAfter(‘ ‘+#13);

st:= dmIAS.aqExe.FieldByName(‘indx’).AsString

+ ‘ ‘

+ dmIAS.aqExe.FieldByName(‘name_r’).AsString;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

end;

dmIAS.aqExe.Next;

end;

wa.Disconnect;

end;

procedure TfrmMain.N12Click(Sender: TObject);

begin

frmEditPubl.ShowModal;

end;

end.

unit uFuzzySearch;

interface

function IndistinctMatching(MaxMatching:Integer; strInputMatching:WideString; strInputStandart:WideString):Integer;

implementation

uses SysUtils;

type

TRetCount = packed record

lngSubRows : Word;

lngCountLike : Word;

end;

function Matching(StrInputA:WideString; StrInputB:WideString; lngLen:Integer):TRetCount;

Var

TempRet : TRetCount;

PosStrB : Integer;

PosStrA : Integer;

StrA : WideString;

StrB : WideString;

StrTempA : WideString;

StrTempB : WideString;

begin

StrA := String(StrInputA);

StrB := String(StrInputB);

For PosStrA:= 1 To Length(strA) — lngLen + 1 do

begin

StrTempA:= System.Copy(strA, PosStrA, lngLen);

For PosStrB:= 1 To Length(strB) — lngLen + 1 do

begin

StrTempB:= System.Copy(strB, PosStrB, lngLen);

If SysUtils.AnsiCompareText(StrTempA,StrTempB) = 0 Then

begin

Inc(TempRet.lngCountLike);

break;

end;

end;

Inc(TempRet.lngSubRows);

end; // PosStrA

Matching.lngCountLike:= TempRet.lngCountLike;

Matching.lngSubRows := TempRet.lngSubRows;

end; { function }

//——————————————————————————

function IndistinctMatching(MaxMatching:Integer; strInputMatching:WideString; strInputStandart:WideString):Integer;

Var

gret : TRetCount;

tret : TRetCount;

lngCurLen: Integer ; //текущаядлинаподстроки

begin

//если не передан какой-нибудь параметр, то выход

If (MaxMatching = 0) Or (Length(strInputMatching) = 0) Or

(Length(strInputStandart) = 0) Then

begin

IndistinctMatching:= 0;

exit;

end;

gret.lngCountLike:= 0;

gret.lngSubRows := 0;

// Цикл прохода по длине сравниваемой фразы

For lngCurLen:= 1 To MaxMatching do

begin

//Сравниваем строчку A со строчкой B

tret:= Matching(strInputMatching, strInputStandart, lngCurLen);

gret.lngCountLike := gret.lngCountLike + tret.lngCountLike;

gret.lngSubRows := gret.lngSubRows + tret.lngSubRows;

//Сравниваем строчку B со строчкой A

//tret:= Matching(strInputStandart, strInputMatching, lngCurLen);

//gret.lngCountLike := gret.lngCountLike + tret.lngCountLike;

//gret.lngSubRows := gret.lngSubRows + tret.lngSubRows;

end;

If gret.lngSubRows = 0 Then

begin

IndistinctMatching:= 0;

exit;

end;

IndistinctMatching:= Trunc((gret.lngCountLike / gret.lngSubRows) * 100);

end;

end.

unit uClassify;

interface

uses

Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,

Dialogs, StdCtrls, ExtCtrls, Mask, DBCtrls, Grids, DBGridEh, ComCtrls,

WordXP, OleServer;

type

TfrmClassify = class(TForm)

Panel1: TPanel;

Panel2: TPanel;

Label1: TLabel;

DBNavigator1: TDBNavigator;

dbmText: TDBMemo;

Panel3: TPanel;

Label7: TLabel;

Button2: TButton;

Panel4: TPanel;

Label6: TLabel;

Label3: TLabel;

dbAuthor: TDBEdit;

Label2: TLabel;

dbDate: TDBEdit;

Label4: TLabel;

dbName: TDBEdit;

Label5: TLabel;

dbKeywords: TDBEdit;

pbClassify: TProgressBar;

dbgClassify: TDBGridEh;

Button1: TButton;

Label8: TLabel;

dbFile: TDBEdit;

lblCountArticles: TLabel;

Button3: TButton;

wd: TWordDocument;

wa: TWordApplication;

wf: TWordFont;

procedure SetDBElemColor(flColor: boolean);

procedure Button1Click(Sender: TObject);

procedure Button2Click(Sender: TObject);

procedure FormCreate(Sender: TObject);

procedure FormShow(Sender: TObject);

procedure Button3Click(Sender: TObject);

private

{ Private declarations }

public

{ Public declarations }

end;

var

frmClassify: TfrmClassify;

implementation

uses uDataModule, uFuzzySearch, uClassifySettings, uStructs;

{$R *.dfm}

procedure TfrmClassify.SetDBElemColor(flColor: boolean);

begin

if frmClassify = nil

then exit;

if flColor

then

begin

dbName.Color:= clMoneyGreen;

dbKeywords.Color:= clMoneyGreen;

dbmText.Color:= clMoneyGreen;

end

else

begin

dbName.Color:= clWindow;

dbKeywords.Color:= clWindow;

dbmText.Color:= clWindow;

end;

end;

procedure TfrmClassify.Button1Click(Sender: TObject);

var id_publ, id_rubr, level,

Name_cnt, Text_cnt, Key_cnt, im,

iNamePorog12, iTextPorog12, iKeyPorog12,

iNamePorog23, iTextPorog23, iKeyPorog23,

iFuzzyPorog: integer;

stWord, res: string;

function GetRes(NameCnt, TextCnt, KeyCnt: integer): String;

begin

if (NameCnt < iNamePorog12)

and (TextCnt < iTextPorog12)

and (KeyCnt < iKeyPorog12)

then result:= ‘-‘

else

if (NameCnt >= iNamePorog23)

or (TextCnt >= iTextPorog23)

or (KeyCnt >= iKeyPorog23)

then result:= ‘+’

else result:= ‘?’;

end;

begin

// Устанавливаемпорогисрабатывания

iNamePorog12:= frmClassifySettings.GetNamePorog(12);

iTextPorog12:= frmClassifySettings.GetTextPorog(12);

iKeyPorog12:= frmClassifySettings.GetKeyPorog(12);

iNamePorog23:= frmClassifySettings.GetNamePorog(23);

iTextPorog23:= frmClassifySettings.GetTextPorog(23);

iKeyPorog23:= frmClassifySettings.GetKeyPorog(23);

iFuzzyPorog:= frmClassifySettings.GetFuzzyPorog;

// Начинаем систематизацию

dmIAS.aqDict.Close;

dmIAS.aqDict.Open;

dmIAS.TruncClassify;

pbClassify.Position:= 0;

pbClassify.Max:= dmIAS.atPublikatsii.RecordCount * (dmIAS.aqDict.RecordCount+1);

with dmIAS.atPublikatsii do

begin

First;

while not Eof do

begin

id_publ:= FieldByName(‘id_publ’).AsInteger;

Name_cnt:= 0;

Text_cnt:= 0;

Key_cnt:= 0;

dmIAS.aqDict.First;

id_rubr:= dmIAS.aqDict.FieldByName(‘id’).AsInteger;

level:= dmIAS.aqDict.FieldByName(‘level’).AsInteger;

while not dmIAS.aqDict.Eof do

begin

// Классифицируем по словарю для каждой рубрики

if id_rubr <> dmIAS.aqDict.FieldByName(‘id’).AsInteger

then

begin

res:= GetRes(Name_cnt, Text_cnt, Key_cnt);

dmIAS.InsertClassify(id_publ, id_rubr, level, Name_cnt,

Text_cnt, Key_cnt, res);

id_rubr:= dmIAS.aqDict.FieldByName(‘id’).AsInteger;

level:= dmIAS.aqDict.FieldByName(‘level’).AsInteger;

Name_cnt:= 0;

Text_cnt:= 0;

Key_cnt:= 0;

end;

stWord:= AnsiUpperCase(dmIAS.aqDict.FieldByName(‘Word‘).AsString);

// Классификацияпонаименованию

im:= IndistinctMatching(length(stWord),

stWord,

AnsiUpperCase(FieldByName(‘name_publ’).AsString));

if im > iFuzzyPorog

then Inc(Name_cnt);

// Классификацияпотексту

im:= IndistinctMatching(length(stWord),

stWord,

AnsiUpperCase(FieldByName(‘text_publ’).AsString));

if im > iFuzzyPorog

then Inc(Text_cnt);

// Классификацияпоключевымсловам

im:= IndistinctMatching(length(stWord),

stWord,

AnsiUpperCase(FieldByName(‘keywords’).AsString));

if im > iFuzzyPorog

then Inc(Key_cnt);

dmIAS.aqDict.Next;

pbClassify.StepIt;

Application.ProcessMessages;

end;

res:= GetRes(Name_cnt, Text_cnt, Key_cnt);

dmIAS.InsertClassify(id_publ, id_rubr, level, Name_cnt,

Text_cnt, Key_cnt, res);

Next;

pbClassify.StepIt;

Application.ProcessMessages;

end;

end;

dmIAS.aqClassify.Close;

dmIAS.atPublikatsii.First;

dmIAS.aqClassify.Open;

Application.ProcessMessages;

ShowMessage(‘Классификацияуспешнозавершена.’);

end;

procedure TfrmClassify.Button2Click(Sender: TObject);

var i, i_rubr, level: integer;

begin

if dbgClassify.SelectedRows.Count = 0

then

begin

ShowMessage(‘Не выбрано ни одной записи!’);

exit;

end;

// Удалить все записи из Publ_Rubr для данной статьи

dmIAS.DeleteFromPublRubr(dmIAS.atPublikatsii.FieldByName(‘id_publ’).AsInteger);

// Записать в Publ_Rubr все избранные рубрики для данной статьи

for i:= 0 to dbgClassify.SelectedRows.Count-1 do

begin

dbgClassify.DataSource.DataSet.GotoBookmark(Pointer(dbgClassify.SelectedRows.Items[i]));

i_rubr:= dbgClassify.DataSource.DataSet.FieldByName(‘id’).AsInteger;

level:= dbgClassify.DataSource.DataSet.FieldByName(‘level_r’).AsInteger;

dmIAS.InsertIntoPublRubr(dmIAS.atPublikatsii.FieldByName(‘id_publ’).AsInteger,

i_rubr,

level);

end;

dbgClassify.DataSource.DataSet.GotoBookmark(Pointer(dbgClassify.SelectedRows.Items[0]));

ShowMessage(‘Надлежащие статье рубрики сохранены.’);

dmIAS.atObrPublikatsii.Close;

dmIAS.atObrPublikatsii.Open;

dmIAS.atCountObrPublikatsii.Close;

dmIAS.atCountObrPublikatsii.Open;

lblCountArticles.Caption:= ‘Всеговбазе: ‘

+ IntToStr(dmIAS.atPublikatsii.RecordCount)

+ ‘ статей. ‘

+ ‘ Классифицировано ‘

+ IntToStr(dmIAS.atCountObrPublikatsii.RecordCount)

+ ‘ статей.’;

end;

procedure TfrmClassify.FormCreate(Sender: TObject);

begin

frmClassifySettings.SetNamePorog(2, 12);

frmClassifySettings.SetTextPorog(3, 12);

frmClassifySettings.SetKeyPorog(2, 12);

frmClassifySettings.SetNamePorog(4, 23);

frmClassifySettings.SetTextPorog(6, 23);

frmClassifySettings.SetKeyPorog(4, 23);

frmClassifySettings.SetFuzzyPorog(50);

frmClassifySettings.SetflShowAll(true);

end;

procedure TfrmClassify.FormShow(Sender: TObject);

begin

{ if frmClassifySettings.GetflShowAll

then // Показыватьвсестатьи

with dmIAS.atPublikatsii do

begin

Close;

SQL.Text:= stSelectAllPubl;

Open;

end

else // Показыватьнеобработанныестатьи

with dmIAS.atPublikatsii do

begin

Close;

SQL.Text:= stSelectNeobrPubl;

Open;

end;}

lblCountArticles.Caption:= ‘Всеговбазе: ‘

+ IntToStr(dmIAS.atPublikatsii.RecordCount)

+ ‘ статей. ‘

+ ‘ Классифицировано ‘

+ IntToStr(dmIAS.atCountObrPublikatsii.RecordCount)

+ ‘ статей.’;

end;

procedure TfrmClassify.Button3Click(Sender: TObject);

var tmpl, Template, NewTemplate, ItemIndex: olevariant;

ARange: Range;

pars: Paragraphs;

par: Paragraph;

tbls: Tables;

tbl1: Table;

st: string;

vcol: OleVariant;

i: integer;

begin

try

wa.Connect;

wa.Visible := True;

except

MessageDlg(‘АуВас Word неустановлен :(‘, mtError, [mbOk], 0);

Abort;

end;

ItemIndex:= 1;

Template:= EmptyParam;

NewTemplate := False;

// Созданиедокумента

wa.Documents.Add(Template, NewTemplate, EmptyParam, EmptyParam) ;

wd.ConnectTo(wa.Documents.Item(ItemIndex));

wd.PageSetup.Set_Orientation(wdOrientLandscape);

wa.Options.CheckSpellingAsYouType := False;

wa.Options.CheckGrammarAsYouType := False;

ARange:= wd.Range(EmptyParam, EmptyParam);

pars:= wd.Paragraphs;

tmpl:= ARange;

par:= pars.Add(tmpl);

wf.ConnectTo(wd.Sentences.Get_Last.Font);

wd.Range.Paragraphs.Set_Alignment(wdAlignParagraphLeft);

wa.Selection.Font.Bold:= 1;

wa.Selection.Font.Size:= 16;

st:= ‘отчет по результатам систематизации статьи ‘;

wa.Selection.InsertAfter(st+#13);

wa.Selection.InsertAfter(‘ ‘+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

wa.Selection.Font.Bold:= 0;

wa.Selection.Font.Size:= 14;

st:= ‘Датапубликации: ‘;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

if (dmIAS.atPublikatsii.FieldByName(‘data’).AsString = ‘30.12.1899’)

then st:= ‘ ‘

else st:= dmIAS.atPublikatsii.FieldByName(‘data’).AsString;

wa.Selection.InsertAfter(st+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= ‘Файлпубликации: ‘;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= dmIAS.atPublikatsii.FieldByName(‘file’).AsString;

wa.Selection.InsertAfter(st+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= ‘Названиепубликации: ‘;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= dmIAS.atPublikatsii.FieldByName(‘name_publ’).AsString;

wa.Selection.InsertAfter(st+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= ‘Ключевыеслова: ‘;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= dmIAS.atPublikatsii.FieldByName(‘keywords’).AsString;

wa.Selection.InsertAfter(st+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= ‘Авторпубликации: ‘;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= dmIAS.atPublikatsii.FieldByName(‘author’).AsString;

wa.Selection.InsertAfter(st+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= ‘Текстпубликации: ‘;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

st:= dmIAS.atPublikatsii.FieldByName(‘text_publ’).AsString;

wa.Selection.InsertAfter(st+#13);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

wa.Selection.InsertAfter(‘ ‘+#13);

st:= ‘Результатыклассификации:’;

wa.Selection.InsertAfter(st);

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

ARange:= wd.Sentences.Last;

tbls:= ARange.Tables;

tbl1:= tbls.Add(ARange,

dmIAS.aqClassify.RecordCount+1, // числострок

6, // числостолбцов

EmptyParam,

EmptyParam);

tbl1.Cell(1, 1).Range.Text:= ‘Код’;

tbl1.Cell(1, 2).Range.Text:= ‘Наименование’;

tbl1.Cell(1, 3).Range.Text:= ‘Поназв.’;

tbl1.Cell(1, 4).Range.Text:= ‘Потексту’;

tbl1.Cell(1, 5).Range.Text:= ‘Покл.сл.’;

tbl1.Cell(1, 6).Range.Text:= ‘Итог’;

i:= 2;

dmIAS.aqClassify.First;

while not dmIAS.aqClassify.Eof do

begin

tbl1.Cell(i, 1).Range.Text:= dmIAS.aqClassify.FieldByName(‘indx’).AsString;

tbl1.Cell(i, 2).Range.Text:= dmIAS.aqClassify.FieldByName(‘name_r’).AsString;

tbl1.Cell(i, 3).Range.Text:= dmIAS.aqClassify.FieldByName(‘name_cnt’).AsString;

tbl1.Cell(i, 4).Range.Text:= dmIAS.aqClassify.FieldByName(‘text_cnt’).AsString;

tbl1.Cell(i, 5).Range.Text:= dmIAS.aqClassify.FieldByName(‘key_cnt’).AsString;

tbl1.Cell(i, 6).Range.Text:= dmIAS.aqClassify.FieldByName(‘res’).AsString;

dmIAS.aqClassify.Next;

Inc(i);

end;

vcol := wdCollapseEnd;

wa.Selection.Collapse(vcol);

wa.Disconnect;

dmIAS.aqClassify.First;

end;

end.

]]>