научная статья по теме НОВАЯ ВЕРСИЯ ИНДЕКСА ХИРША – J-ИНДЕКС Общие и комплексные проблемы естественных и точных наук

Текст научной статьи на тему «НОВАЯ ВЕРСИЯ ИНДЕКСА ХИРША – J-ИНДЕКС»

ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК, 2014, том 84, № 6, с. 532-535

ТОЧКА == ЗРЕНИЯ

Б01: 10.7868/80869587314060085

Проблема объективных критериев эффективности научной деятельности — одна из широко обсуждаемых в настоящее время тем, в том числе на страницах нашего журнала. Автор публикуемой статьи обращается к ней не впервые. На этот раз он предлагает свой вариант индекса цитируемости, который призван преодолеть недостатки индекса Хирша.

НОВАЯ ВЕРСИЯ ИНДЕКСА ХИРША - у-ИНДЕКС

О.В. Михайлов

В истории создания объективных критериев оценки научной деятельности навсегда останется имя американского физика Хорхе Хирша (Jorge E. Hirsch), который в 2005 г. в своей оригинальной статье [1] ввёл в научный оборот индекс цитируемости индивидуального учёного-исследователя, получивший в его честь название "h-индекс" ("индекс Хирша" или просто "хирш"). Согласно самому создателю этого термина, "исследователь имеет индекс h, если h из его N статей цитируются как минимум h раз каждая, в то время как оставшиеся (N — А) статей цитируются не более, чем h раз каждая" [1, р. 16569]. Позднее Х. Хирш дал более сложное определение указанного наукометрического параметра, а именно: "Учёный имеет индекс h, если h его статей принадлежат к его h-ядру. Статья относится к h-ядру учёного, если она имеет >h цитирований. Состав h-ядра необязательно уникален, ибо может существовать более одной статьи с количеством цитирований, равным h" [2, р. 742].

Предложенный Х. Хиршем параметр цитируе-мости на удивление быстро стал популярным в научной среде; в настоящее время именно он считается едва ли не основным показателем научной активности и авторитетности исследователя, оттеснив на второй план все аналогичные парамет-

МИХАЙЛОВ Олег Васильевич — доктор химических наук, главный научный сотрудник и профессор кафедры аналитической химии, сертификации и менеджмента качества Казанского национального исследовательского технологического университета. olegmkhlv@gmail.com

ры, в частности, общую цитируемость опубликованных им работ. И это при том, что между й-ин-дексом исследователя и общим числом ссылок на его работы нет прямой корреляции. Если вы, к примеру, опубликовали всего лишь пять статей и этим ограничились, тогда ваш "хирш" рано или поздно доберётся до 5, но выше не поднимется, даже если ваши статьи будут процитированы миллион раз. К слову, цифра 5 здесь взята не с потолка: именно столько статей по интерпретации феномена фотоэффекта опубликовал к 1906 г. один из величайших физиков всех времён и народов А. Эйнштейн. И если бы он вдруг ушёл в мир иной в начале названного года, то его й-индекс на этой цифре и остановился бы, при том что эти пять статей в дальнейшем цитировались бы несчётное число раз.

Несмотря на это, "хиршеметрия", то есть определение индекса Хирша, ныне занимает и волнует умы всех серьёзных исследователей, претендующих на авторитет и известность в науке. Чего греха таить, немало работающих в науке сейчас ломают голову не столько над решением сугубо научных проблем, сколько над тем, как бы повысить свой личный "хирш". Спрос же, как известно, рождает предложение — появились и рекомендации на тему улучшения этого индекса (см., например, [3]). Судя по всему, й-индекс закрепился в наукометрии и в науке, поэтому одной из актуальных проблем становится совершенствование этого параметра. На этот счёт сделано уже немало; тот же Хирш, видя несовершенство своего детища, в уже упомянутой статье [2] предложил его модифицировать и ввёл параметр й, учитывающий число соавторов: "Исследователь имеет индекс й, если й его работ принадлежат его ядру й. Статья принадлежит й-ядру учёного, если он имеет >й ссылок и, кроме того, принадлежит й-ядру каждого из соавторов статьи".

В развитие этой идеи Хирша автор настоящей статьи в работе [4] предложил свой вариант моди-

НОВАЯ ВЕРСИЯ ИНДЕКСА ХИРША - у-ИНДЕКС

533

фикации h-индекса, введя в обиход А*-индекс, который определяется аналогично традиционному "хиршу", но с одной существенной поправкой: вместо общего числа ссылок Ni на каждую i-ю статью во внимание принимается так называемая долевая цитируемость, определяемая как (N/n), где ni — суммарное число авторов в i-й статье. В связи с этим нельзя не упомянуть и весьма интересный подход к модификации А-индекса, предложенный Лео Эггом в 2006—2008 гг. [5—7]. Исследователь имеет модифицированный индекс g, если g из его N статей цитируются как минимум g2 раз каждая, в то время как оставшиеся (N—g) статьи цитируются не более чем g2 раз каждая. (По аналогии с индексом Хирша его следовало бы по фамилии создателя назвать е-индексом, но в литературе привился именно только что указанный термин — g-индекс.) На фоне высочайшей популярности h-индекса этот наукометрический показатель, однако, остался почти незамеченным, но поскольку он весьма важен для дальнейшего нашего повествования, на нём стоит остановиться подробнее.

Подобно индексу Хирша, индекс Эгга — также целочисленная величина, и для любого исследователя он опять-таки не больше, нежели суммарное количество его статей. Ну а реально он, конечно же, гораздо меньше этого количества. В частности, чтобы достичь индекса g = 3, нужно иметь как минимум 3 статьи, каждая из которых цитируется минимум 9 раз, для g = 10 — минимум 10 статей, на каждую из которых сделано минимум 100 ссылок с общим числом цитирований >1000, и т.д. Прикинем: для достижения h = 20 нужно 20 статей, на каждую из которых сделано по 20 ссылок, то есть с общим числом цитирований 400; так что добиться "эгга", равного 10, куда сложнее, чем "хирша", равного 20. При определении g-индекса принимается во внимание то важное обстоятельство, что некоторые из наиболее цитируемых статей того или иного исследователя могут быть очень высокоцитируемыми (чего индекс Хирша практически "не замечает"). Стоит отметить, что g-индекс и замышлялся его автором именно для исправления вышеуказанного недостатка h-индекса. Насколько это может быть важным, иллюстрирует следующий пример.

Пусть у некоего исследователя имеется 10 статей, на 6 из которых было сделано 15 ссылок, ещё на 3 — по 25 и на оставшуюся 1 — 50, а все остальные его статьи (каковых, скажем, 20) цитировались менее 10 раз каждая. У другого же исследователя — 2 статьи, каждая из которых цитировалась по 20 раз, 1 статья цитировалась 40 раз, 4 — по 50 раз каждая, одна — 75 раз, одна — 100 раз и одна — 200 раз, а все остальные статьи (каковых тоже 20) — менее 10 раз каждая. У третьего исследователя — 4 статьи, на каждую из которых было сделано по

13 ссылок, 3 статьи — по 12 ссылок, 3 статьи — по 11 ссылок, 6 статей — по 10 ссылок, а остальные 20 цитировались по 9 раз и менее. В итоге получаем, что у всех троих исследователей А-индекс окажется одинаковым и составит 10. Однако совершенно очевидно, что реальный показатель ци-тируемости второго исследователя в целом значительно лучше, нежели первого и тем более третьего, и именно это различие призван подчеркнуть ^-индекс. У первого из них он составляет 4 (ибо у него имеется 4 статьи, каждая из которых была процитирована 16 и более раз), тогда как у второго — 7 (поскольку у него 7 статей, каждая из которых процитирована более 49 раз), у третьего же — лишь 3, ибо в его активе хоть и 10 статей, каждая из которых цитировалась 9 и более раз, но нет даже одной статьи, которая цитировалась бы 16 и более раз.

В принципе не исключён (и даже вполне вероятен) вариант, когда у двух исследователей А и В для значений их А-индексов имеет место соотношение Аа > АВ, а для их ^-индексов — соотношение 8А < 8В. И вообще, соотношение между суммарной цитируемостью, индексом Хирша и ^-индексом различных исследователей в некотором роде напоминает соотношение между общим количеством забитых за всю карьеру футболиста голов, максимальным количеством мячей, забитых им за сезон, и максимальным количеством мячей, забитых в одном матче. Понятно, что тот, кто забил за свою карьеру больше всех мячей, не всегда является рекордсменом и по количеству мячей, забитых за сезон, и тем более в одном матче. Так, рекорд по общему количеству забитых мячей в чемпионатах СССР (211 мячей) принадлежит форварду киевского "Динамо" О. Блохину; рекорд по общему количеству забитых мячей в одном чемпионате СССР (35 мячей) — форварду днепропетровского "Днепра" О. Протасову; первенство по количеству забитых мячей в одном матче чемпионата СССР (5 мячей) — сразу нескольким футболистам, среди которых, однако, ни Блохин, ни Протасов не значатся.

В соответствии с определением ^-индекса минимальное число ссылок на публикации исследователя с конкретным значением данного параметра составляет g3 (тогда как минимальное число ссылок на публикации исследователя с данным значением А-индекса — А2). Поскольку средний показатель по суммарной цитируемости отдельно взятых сотрудников даже ведущих российских вузов (МГУ, СПбГУ, национальные исследовательские университеты) и учреждений Российской академии наук вряд ли превышает 100 ссылок, то, в соответствии с вышесказанным, максимальное значение усреднённого g-индекса будет составлять не более чем (100)1/3, то есть не более 5. Реально же, как показали проведённые нами иссле-

534

МИХАЙЛОВ

Числовое значение индекса Минимальное количество ссылок на каждую из процитированных статей, необходимое для достижения данного значения индекса Числовое значение индекса Минимальное количество ссылок на каждую из процитированных статей, необходимое для достижения данного значения индекса

к £ у к £ у

1 1 1 1 16 16 256 64

2 2 4 2 17 17 289 70

3 3 9 5 18 18 324 76

4 4 16 8 19 19 361 82

5 5 25 11 20 20 400 89

6 6 36 14 21 21 441 96

7 7 49 18 22 22 484 103

8 8 64 22 23 23 529 110

9 9 81 27 24 24 576 117

10 10 100 31 25 25 625 125

11 11 121 36 26 26 676 132

12 12 144 41 27 27 729 140

13 13 169 46 28 28 784 148

14 14 196 52 29 29 841 156

15 15 225 58 30 30 900 164

дования, он не превышает и 2 (что означает наличие у взятого нами среднестатистического автора лишь 2 статей, каждая из которых цитируется 4 раза и более).

В работах [8, 9] были выделены три категории исследователей — с индекс

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком