Технология анализа текста и извлечения ключевых слов презентация

Содержание


Презентации» Информатика» Технология анализа текста и извлечения ключевых слов
ТЕХНОЛОГИЯ АНАЛИЗА ТЕКСТА И ИЗВЛЕЧЕНИЯ КЛЮЧЕВЫХ СЛОВ
 Студент группы 320602
 КотиковЦЕЛЬ РАБОТЫ
 практическое освоение технологии анализа текста;
 извлечение ключевых слов; 
ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
 Знание общих принципов функционирования поисковых средств и умение грамотноТЕОРЕТИЧЕСКАЯ ЧАСТЬ
 Джордж Зипф установил, что все тексты подчиняются общим закономерностям,ТАБЛИЦА КЛЮЧЕВЫХ СЛОВ (ручной поиск)
 Список слов текста-источника, отсортированный по убываниюГрафик зависимости частоты вхождения слова от ранга
 В данном случае целесообразноФОРМУЛИРОВКА ПОИСКОВОГО ЗАПРОСА (ручной поиск)
 Запрос будет состоять из слов сПрограммы-экстракторы
 RCO Fact Extractor – это интеллектуальная программа для высокоточного избирательногоИСПОЛЬЗОВАНИЕ TextAnalyst
 Персональная система автоматического анализа текста TextAnalyst предназначена для анализа содержанияТАБЛИЦА КЛЮЧЕВЫХ СЛОВ (TextAnalyst)График зависимости частоты вхождения слова от рангаФОРМУЛИРОВКА ПОИСКОВОГО ЗАПРОСА (TextAnalyst)
 Поисковой запрос с использованием ключевого слова «ИЛИ»ЗАКЛЮЧЕНИЕ
 В ходе выполнения данной лабораторной работы я ознакомился с одной



Слайды и текст этой презентации
Слайд 1
Описание слайда:
ТЕХНОЛОГИЯ АНАЛИЗА ТЕКСТА И ИЗВЛЕЧЕНИЯ КЛЮЧЕВЫХ СЛОВ Студент группы 320602 Котиков Е.В.


Слайд 2
Описание слайда:
ЦЕЛЬ РАБОТЫ практическое освоение технологии анализа текста; извлечение ключевых слов; профессионального поиска информации.

Слайд 3
Описание слайда:
ТЕОРЕТИЧЕСКАЯ ЧАСТЬ Знание общих принципов функционирования поисковых средств и умение грамотно составить запрос поисковой машине необходимые, но недостаточные условия успешного поиска требуемой информации. Выбор ключевых слов в данном случае может осуществить специалист узкого профиля, но труд его дорог и малопроизводителен, или специальные программные средства, основанные на применении законов Зипфа.

Слайд 4
Описание слайда:
ТЕОРЕТИЧЕСКАЯ ЧАСТЬ Джордж Зипф установил, что все тексты подчиняются общим закономерностям, и сформулировал в 1946—49 гг. несколько законов, которые нашли применение в технологии поиска информации. Первый закон Зипфа утверждает, что произведение частоты встречи слова в тексте (или вероятности встречи слова по Зипфу) на его ранг есть величина приблизительно постоянная для любых текстов определенного языка, т.е. имеет место C = f*R ~ const.

Слайд 5
Описание слайда:
ТАБЛИЦА КЛЮЧЕВЫХ СЛОВ (ручной поиск) Список слов текста-источника, отсортированный по убыванию их частот, представлен в следующей таблице

Слайд 6
Описание слайда:
График зависимости частоты вхождения слова от ранга В данном случае целесообразно выбрать диапазон значений ранга слов, равный первым восьми рангам (10 слов).

Слайд 7
Описание слайда:
ФОРМУЛИРОВКА ПОИСКОВОГО ЗАПРОСА (ручной поиск) Запрос будет состоять из слов с наивысшим рангом, разделенных логическим оператором «ИЛИ» (or). При этом порядок следования сохраним.

Слайд 8
Описание слайда:
Программы-экстракторы RCO Fact Extractor – это интеллектуальная программа для высокоточного избирательного анализа информации. TextAnalyst – персональная система автоматического анализа текста, разработан а качестве инструмента для анализа содержания текстов, смыслового поиска информации, формирования электронных архивов.

Слайд 9
Описание слайда:
ИСПОЛЬЗОВАНИЕ TextAnalyst Персональная система автоматического анализа текста TextAnalyst предназначена для анализа содержания текстов, смыслового поиска информации и формирования электронных архивов. TextAnalyst предоставляет пользователю следующие возможности:  анализ содержания текста с автоматическим формированием семантической сети с гиперссылками - получения смыслового портрета текста в терминах основных понятий и их смысловых связей;  анализ содержания текста с автоматическим формированием тематического древа с гиперссылками - выявления семантической структуры текста в виде иерархии тем и подтем;  смысловой поиск с учетом скрытых смысловых связей слов запроса со словами текста;  автоматическое реферирование текста - формирования его смыслового портрета в терминах наиболее информативных фраз;  кластеризация информации - анализ распределения материала текстов по тематическим классам; автоматическая индексация текста с преобразованием в гипертекст;  ранжирование всех видов информации о семантике текста по «степени значимости» с возможностью варьирования детальности ее исследования;  автоматическое/автоматизированное формирование полнотекстовой базы знаний с гипертекстовой структурой и возможностями ассоциативного доступа к информации. TextAnalys позволяет осуществлять эффективную семантическую обработку текстов с извлечением ключевых слов и выражений.

Слайд 10
Описание слайда:
ТАБЛИЦА КЛЮЧЕВЫХ СЛОВ (TextAnalyst)

Слайд 11
Описание слайда:
График зависимости частоты вхождения слова от ранга

Слайд 12
Описание слайда:
ФОРМУЛИРОВКА ПОИСКОВОГО ЗАПРОСА (TextAnalyst) Поисковой запрос с использованием ключевого слова «ИЛИ» (or):

Слайд 13
Описание слайда:
ЗАКЛЮЧЕНИЕ В ходе выполнения данной лабораторной работы я ознакомился с одной из методик выбора ключевых слов поискового запроса, применил ее для поиска необходимого документа, т.е. осуществил профессиональный поиск информации. Также познакомился с работой программы-экстрактора TextAnalyst, выполнил с ее помощью анализ текста и, на основе полученных данных, построил поисковой запрос.


Скачать презентацию на тему Технология анализа текста и извлечения ключевых слов можно ниже:

Похожие презентации