©..

Проект использован в качестве дипломной работы в политехническом институте Санкт Петербурга 2004.

WORLD WIDE WEB

2 января 1969 г является днем рождение компьютерной сети ARPANET / сеть - для профи /

Структура:
   
Портал /Каталоги, Поисковые машины /
ISP/ host / sites - провайдер / ресурсы/ страницы
users - пользователь

 

 

 

 

 
Демография сети.

1995 - 16 million
1996 - 55 million
1997 - 70 million
1998 - 160 million
1999 - 201 million
2000 - 451 million
2001 - 552 million
2002 - 605,60 активных пользователей.
Такой же рост наблюдается в электронной комерции

АУДИТОРИЯ


Если в 1995 год колличество технических специалистов сотавляло 19%

то в 2004 году тенденция меняется.

Основные поисковые запросы (для Top Рунета) /в долях/

tatu
 
рефераты
 
doom
 
гороскоп
 
chat
 
знакомства
 
работа
 
sex
 

Происходит демократизация сети. Сеть все больше становится местом досуга, местом развлечения, местом поиска партнера.

 

Основная задача интернета / по мнению пользователей /


Основная задача поиск, хранение и каталогизация информации.

Проблемы


Отсуствие четкой структуры.

Типичные категории вэб каталогов являются условными и не охватывают встающих перед человеком вопросов.
Бизнес и экономика / Общество и политика / Наука и образование / Дом и семья / Развлечения и отдых / Культура и искусство /

Задачи поиска и хранения информации решаются рядом конкурирующих поисковые системы и вэб - каталогов.
Пример - колличество онлайн пользователей на декабрь 1996 года по данным различных организаций.
Killen & Associates - 30 million
Nua Ltd - 55 million
IDC - 36 million
Jupiter - 37 million
Computer Industry Almanac - 61 million
Расброс составляет от 30 до 61 мил.

Для индексации ресурс необходимо внести в базу поисковой машины.

Для корректной работы страница должна отвечать техническим требованиям / составляться профессионалом /.


На результат поиска влияет грамотное составление документа, финасирование ресурса а не СОДЕРЖАНИЕ.

Часть поисковых систем оказывает услуги на платной основе. Что так же влияет на результаты поиска.


65% платный хостинг

     


35% размещено на бесплатных хостингах,
6% из 1000 наиболее посещаемых ресурсов Рунета размещено на службах бесплатного хостинга.
2,5% доля сайтов бесплатных хостингов от 35 миллионов хитов

Основная масса страниц /ресурсы/ никогда не охватываются поисковами машинами.
и не взирая на это на запрос пользователя поисковая ситема выдает сотни документов, просмотреть которые не является возможным физически.

Узкий спектр параметров поисковых систем.

- Семантическая основа работы всех существующих систем поиска.
слово. место слова в документе и т.д.

Пример "Расширенный поиск"

- язык
- дата создания документа
- тип документа


Невозможность нахождения нужного ресурса без его предварительного просмотра.

Невозможность определить, какого рода ресурс лежит на странице до его передачи на компьютер Пользователя (MP3 / Документы / Архивы и т.д.).

Полная неработоспособность рекламных компаний, т.к. реклама показывается хаотически, как следствие, не достигает нужной целевой группы.

С ростом сети названные проблемы не только не решатся, но усугубятся.
Идеология поисковых машин не меняется. Восможен рост производительности лишь за счет:
- наращивания аппаратной мощи
- оттачивания алгоритмов, оптимизации программ.
Однако рабская зависимость от слова остается камнем преткновения.

 

РЕШЕНИЕ ПРОБЛЕМ


Решением проблемы может стать ассоциативно-интуитивная система поиска и хранения информации в сети и персональном компьютере.

«В процессе жизни пользователь метит своей аурой все в сети и все метит пользователя». Вся информация приобретает и «оттачивает» свою ауру.

Ядро системы каталогизации и поиска информации «Аура» представляет из себя набор программ, установленных на компьютере-сервере, обеспечивающих накопление, обработку и поиск информации о перемещениях по сети Интернет зарегистрированных пользователей на основе взаимодействия их профилей, а также хранение изменений текущих профилей пользователей по временно-пространственному принципу.

Ядро отслеживает 10 в 46 степени независимых параметров.

Краткое описание основных функций ядра системы
- Первичная регистрация пользователей в системе с созданием первичного многокомпонентного профиля с произвольным числом компонентов.
- Первичная регистрация ресурсов сети Интернет по протоколу http с присвоением им пустого многокомпонентного профиля с произвольным числом компонентов.
- Сбор информации, поступающей от программы-клиента о ресурсах сети интернет (по протоколу http), посещенных пользователем за данный интервал времени.
- Анализ списка ресурсов сети Интернет, полученных от программ-клиентов и сохранение изменений в профилях пользователей и ресурсов.
- Архивация предыдущих состояний профиля пользователя и/или ресурса сети Интернет по временно-пространственному признаку.
- Обеспечение поиска в сохраненных профилях по признаку полной или частичной идентичности как индивидуальных компонентов профиля, так и профиля в целом.
- Обеспечение преобразования цифрового представления многокомпонентного профиля в цветовой код, доступный для отображения на сервере.
- Обеспечение периодичного резервного копирования всех баз данных.

Краткое описание основных функций программы-клиента
- Мониторинг перемещений зарегистрированного пользователя по ресурсам сети Интернет по протоколу http.
- Хранение списка посещенных пользователем за определенных срок ресурсов сети Интернет.
- Передача созраненного списка ядру системы, расположенному на головном сервере проекта «Аура»
- Перехват метаданных, посылаемых сервером «Аура» пользователю с целью изменения в режиме реального времени отсылаемых данных для обеспечения прозрачного пользовательского интерфейса.
- Работа в виде спрятанной задачи, не мешающей пользователю.

 

В результате проделанной работы получены полностью функциональные ядро и программа-клиент, тесно интегрированные друг с другом, реализующие основной инновационный принцип работы системы каталогизации и поиска информации «Аура», основанный на хранении и взаимодействии профилей пользователей информации по пространственно-временному и психо-поведенческим признакам.

К полученной системе можно подключать графический пользовательский интерфейс, результатом чего явится полностью функционирующий прототип системы, пригодный для массового использования.

Результатом работы ситемы явится:
- структурирование сети по единой схеме / как результат - оптимизация каналов /
- консолидация совместного опыта
- широкий охват ресурсов
- учитывая широчайший уровень параметров, возможность развития системы параллельно с развитием технологий
- независимость от семантики
- определение наиболее подходящего для пользователя ресурса / с учетом географического положения пользователя, возраста, пристрастий, финансового положения и т.д/
- система поможет пользователю осознать а затем и вербализировать собственные пожелания, мотивации в соотвествии с общепринятой схемой. Даст осознание условности существующих схем и интерпретаций действительности.
- использование одной рабочей станции эквивалентно 4 000 станциям /Googly/

 

Техническая реализация.


Программы написаны с использованием языков программирования Perl и PHP/4.0.
С целью обеспечения функционирования ядра были использованы следующие программы и технологии: OS RedHat Linux, Apache Web Server, MySQL, Perl, modperl, PHP 4.0.5, Server Side Includes, Server Push.
Суммарный объем исходных текстов ядра составляет около 227000 символов. Клиент-программа для установки на компьютеры пользователей представляет собой исполняемый модуль для операционной системы MacOS, написанный на языке программирования C++.
В программе-клиенте использованы следующие технологии: OpenTransport, Macintosh Toolbox, Carbon, Server Push.
Общий объем исходных текстов составляет около 183000 символов.

Общее тестирование системы производилось на основе общепризнанных методик, принятых в качестве стандарта "де-факто" для проектов подобного рода. Тесты для проверки системы были разработаны с использованием методик Майерса (Mayers, 1979), Данна (Dunn), Йордона (Yourdon, 1975) и прочих.
Контроль качества программного продукта был произведен на основе внутренней документации проекта, а также с использованием методик Американского общества контроля качества (American Society for Quality Control) (Principles of Quality Costs, Campanella, 1990).