научная статья по теме ИЗМЕРЕНИЕ ИНФОРМАЦИИ В СЕТИМЕТОДИКА БИБЛИОМЕТРИЧЕСКОГО АНАЛИЗА ПЕРСОНАЛИЗИРОВАННЫХ СТРАНИЦ УЧЕНЫХ Культура. Культурология

Текст научной статьи на тему «ИЗМЕРЕНИЕ ИНФОРМАЦИИ В СЕТИМЕТОДИКА БИБЛИОМЕТРИЧЕСКОГО АНАЛИЗА ПЕРСОНАЛИЗИРОВАННЫХ СТРАНИЦ УЧЕНЫХ»

АЛЕКСЕЙ ЕЖОВ

Измерение информации в сет

Методика библиометрического анализа персонализированных страниц ученых

Поиск информации во всемирном сети — задача не всегда простая. Персонализированные страницы —

дополнительный источник биобиблиографических данных, который вскоре может стать основным.

Алексей Николаевич Ежов, библиограф интренет-класса РНБ

МЫ ЖИВЕМ в век информации: скорость ее передачи, нарастающий информационный «шум», требуют от современного человека все большей гибкости и острой восприимчивости с умением отбирать и находить нужное в стремительном информационном потоке.

«Наука начинается там, где начинают измерять», - говорил Д. И. Менделеев. Содержательные исследования сети как информационного и библиографического источника для ученых проводится с конца 90-х годов XX века. Походы к ее описанию связаны с поиском определяющих параметров и характеристик источников информации самой различной природы. В это же время возникает и «вебометрия», изучающая с помощью современных инфометрических (библиомет-рических) методов характер и свойства сети Веб. Вебометрия основана на библиометри-ческих методах, используемых в библиографических базах данных и базах данных цитирования. При помощи вебометрии изучается содержание веб-страниц, сопоставляется их дизайн и содержание, проводится анализ файл-протоколов как источников информации для изучения посещаемости и использования баз данных и интернет-страниц. На базе вебометрии предлагаются всевозможные алгоритмы поиска и рассматриваются различные методы сбора данных в сети. Особо подчеркивается, что сбор данных в сети следует осуществлять очень тщательно из-за постоянных изменений в ней.

В данной статье анализируется лишь одна форма представления информации в сети -персонализированные страницы ученых, которые появились в современном виде в середине 90-х годов XX века, а сейчас становятся все более распространенным средством не только предоставления данных об ученых, но и средством их научной коммуникации и

взаимодействия. Библиометрический анализ персонализированных страниц и их типизация - один из подходов к проблеме их активного использования в библиотечном обслуживании читателей. Для библиографа персонализированная страница — дополнительный источник

Рождение и перспектива использования персонализированных страниц ученых

Умирание эпистолярного жанра (от эпистола (устар.) - письмо, послание) - очень модная тема в современном мире. Обычное почтовое письмо могло утратить свое значение из-за ускорения темпа жизни и, как следствие, из-за повышенной психической мо-биль нос ти сов ре мен но го че ло ве ка. Если еще в XIX веке смена впечатлений ритмически совпадала с доставкой почты даже на лошадях, а ускорением служила фельдсвязь (специальная служба связи, заключавшаяся в пересылке важных секретных документов через фельдъегерей), то технический прогресс XX века, повысивший в несколько раз скорость доставки письма, все-таки перестал ус-пе вать за сме ной настро е ний пи шу ще го письмо человека. С появлением интернета переписка через послание писем приобрела другое качество. Изначальное свое развитие Всемирная паутина получила от электронной переписки и, судя по скорости развития сети, ее темпоритм пока совпадает с внутренним темпоритмом пользующегося новым инструментом письма-послания человека. С точки зрения традиционного письма, эпистолярный жанр делает качественный скачок. Под этим углом зрения персонализированную страницу можно рассматривать как

количественное сохранение собранных в одном месте писем, дневников, мемуаров, резюме и т. п. С появившимися техническими возможностями объявить о себе всему свету стали создаваться (писаться, набираться) персонализированные страницы. Сеть как новый инструмент общения стоит на старом фундаменте - письме.

Большинство веб-серверов, лидирующих ныне в своих областях, когда-то были простыми персонализированными страницами. Персонализированная страница - это фундаментальная основа «всемирной паутины», та первая ячейка, из которой соткан интернет, вернее, самая популярная его составляющая «World Wide Web» («WWW»).

Персонализированная страница - это электронный документ, состоящий из одного и более файлов, содержащих определенный текст и ссылки и размеченных языком программирования HTML и имеющий собствен ный уни каль ный уни вер саль ный местоопределитель ресурса (URL-адрес).

Персонализированная страница - это и история науки, и ее современность, и взгляд вперед, и новые формы научного взаимодействия и общения ученых. Прообразом персонализированной страницы можно считать персонализированные базы данных, а еще глубже - биобиблиографические спра-воч ни ки.

Страницы ученых многогранны, предлагают самые различные текстовые, графические, звуковые, фото- и видеоматериалы о них. Они позволяют быстро уточнять биографические, библиографические сведения о человеке, специалисте. Однако, далеко не каждая персонализированная страница содержит все необходимые библиографу сведения. Для рационального их использования важна типизация страниц по содержательным и техническим признакам.

Методика исследования включала следующие ступени:

Подготовительный этап. Составление списка авторов для поиска персонализированных страниц в сети.

Для этой задачи был использован систематический каталог зарубежных авторов РНБ. Из разделов «Социология» и «Экономика» были взяты подряд без ограничения года, места и типа издания по 10 библиографических описаний из каждого раздела. Так как монографии и статьи очень часто выполнены не одним, а двумя и более авторами, то уже из 20 изданий было выписано 33 автора и/или редактора, чьи имена затем проверялись на наличие персонализирован-

ной страницы в интернете. Поиск проводился через поисковую систему Alta Vista и поисковый каталог Yahoo. Были опробованы также и такие поисковые системы как Lycos и HotBot, но поиск в них не принес никаких дополнительных результатов. На этом этапе исследования в Yahoo и Alta Vista проверялось по 100 ссылок на каждую выписанную фамилию. При поиске из 33 авторов и/или редакторов в интернет-сети было найдено лишь 3 персонализированных страницы: на чешском, сербском и немецком языках. То есть на подготовительном этапе в феврале 2000 года была получена достаточно низкая частота создания персонализированных страниц социологами и экономистами - менее 10 %. Была проведена первичная обработка найденных страниц и выделены возможные 147 признаков их библиометричес-кого анализа.

Этап 1. Изменение условий поиска персонализированных страниц.

После первых пробных попыток поиска пришлось сократить количество испытуемых из-за сложности поиска авторов со специфическим написанием имен и фамилий при наличии букв типа: ь, д, г, ц, у, и и т. п. Например: Hilsnerova Affika; Iluze Askute^ Bibggemann Wolfgang. По причине незнания языков западных славян пришлось отказаться от поиска и обработки этой группы авторов. Тем не менее, была обработана англоязычная пер сона ли зи ро ван ная стра ни ца сло вен ки Татьяны Баджик (Tatiana Bajuk Senear). После смыслового, терминологического, топографического и хронологического уточнения с конкретизацией по языку было решено ограничиться тремя ведущими языками: английским, немецким, французским - и отбором авторов, издавших собственную монографию не ранее 1990 года или выступивших в роли редактора сборника научных работ с указанного года. При осмыслении поисковой ситуации и апробировании каждого заданного элемента на роль определителя поиска критерием отбора авторов, имеющих персонализированную страницу, было заявлено опубликование монографии или редактирование научного сборника не ранее 1990 года. Хронологический охват объясняется тем, что сеть на 1990 год насчитывала десятки ты сяч компь ютеров, а се год ня счет компьютеров в сети идет на сотни миллионов. 1990 год был избран стартовым еще и потому, что система «Word Wide Web», где размещаются персонализированные страницы, была разработана в 1991 году. Монография, как итог интеллектуальной деятельнос-

ти, свидетельствует об определенной научной известности автора и предполагает возможность появления его страницы в сети.

В разделах «Социология» и «Экономика» были просмотрены 1464 библиографических описания за десять лет: 1990-2000 гг. В окончательном варианте были отобраны имена 150 зарубежных авторов с латинской транскрипцией, по которым и осуществлялся поиск персонализированных страниц: 33 (из них 12 экономистов и 21 социолог) человека на «нулевом» цикле и 117 (из них 62 экономиста и 55 социологов) человек при выбранном итоговом определителе поиска. Необходимо отметить, что на первом этапе исследования выписка ряда имен и проверка списка авторов на наличие персонализированной страницы в интернете были совмещены по времени и проводились параллель но.

Сначала в поисковых системах, при наличии длинного списка найденных адресов с указанной фамилией автора, просматривалось до 100 первых ссылок. Но приобретенный опыт показал, что рационально ограничиться 50 ссылками. Персонализированные страницы находились на самых разных позициях при поиске: под первым, двенадцатым-пятнадцатым и даже тридцатым и более, но не далее пятидесятого номера выданного списка электронных адресов. Для ускорения поиска постепенно сложился собственный метод:

1. Вводилась фамилия автора с инициалами и указанием сферы деятельности.

2. Отыскивалась любая сетевая страница с расшифровкой инициалов автора.

3. Затем вводилась фамилия и полное имя автора.

4. Иногда (при наличии полного тезки) для перепроверки к полному имени добавлялась сфера деятельности.

При таком приеме поиска при наличии персонализированных страниц поисковая система Alta Vista и поисковый каталог Yahoo отмечали их в первой десятке ссылок. В случае распространенных фамилий такая процедура значительно сокращала список выдаваемых поисковиком электронных адресов. Оставалось только уточнить область деятельности выдаваемого поисковой системой автора для исключения полного тезки исследуемого лица: на 50 авторов пришлось 9 человек однофамильцев с теми же инициалами и 2 полных тезки,

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком