«Наука в Сибири»
№ 44 (2679)
6 ноября 2008 г.

О РЕЙТИНГЕ САЙТОВ
НАУЧНЫХ ОРГАНИЗАЦИЙ СО РАН

В настоящее время уже не обсуждается вопрос о необходимости существования сайта научной организации, все исследовательские центры имеют официальные сайты. И, конечно, возникает естественное желание их сравнить, а затем такое сравнение использовать при развитии сайтов.

О.А. Клименко, Ю.И. Шокин

Существуют разные методы определения полноты представления организации в сети Интернет. Мы проведем анализ сайтов научных организаций СО РАН методами вебометрики.

Вебометрика (webometrics) возникла после расширения понятия «библиометрика» на веб-пространство. Библиометрика представляет собой набор методов для изучения текстов и информации, методы библиометрики включают анализ цитирования и контентный анализ. Термин вебометрика ввели Т. Алминд и П. Игверсен в 1997 г. Ими дано определение вебометрики как науки о количественных аспектах создания и использования информационных ресурсов, структур и технологий в веб-пространстве, выросшей из библиометрики и информатики.

Веб-пространство — новый тип информационного ресурса без централизованного контроля, без координированного индексирования содержания. Однако веб-пространство не является хаотической системой, в нем происходит самоорганизация в группы. Веб-пространство организуется путем взаимодействия большого числа индивидуумов и групп. Связи между разными документами устанавливаются с помощью ссылок. Изучение этих ссылок с помощью методов вебометрики позволяет определять устройство веб-пространства.

Для исследования веб-сайта используются несколько количественных параметров. П. Игверсен ввел в 1998 г. понятие Web Impact Factor (WIF). WIF — это отношение числа входящих ссылок на сайт V к общему числу страниц сайта S. Однако для определения качества сайта бывает недостаточно использовать WIF. Параметр S определяется поисковыми системами и может существенно отличаться от реального числа страниц сайта, поэтому значение параметра WIF зависит от используемой поисковой системы, от языка сайта и других факторов.

Регулярные исследования университетской и академической среды ведутся лабораторией Cybermetrics Lab, которая принадлежит Consejio Superior Investigaciones Cienthficas — крупнейшему исследовательскому центру Испании. Первоначально проект Webometrics Ranking of World Universities (далее проект Webometrics) был направлен на стимулирование веб-публикаций. Рейтинг составлялся исходя не из числа визитов и дизайна сайта, а основывался на полноте представления университета в сети. Со временем рейтинг университетов приобрел популярность, а в число организаций, которые оцениваются, были включены академические институты и научные центры. В июле 2008 г. в рейтинг 1000 научных организаций вошли Портал СО РАН (66 место) и Портал РАН (91 место).

Предметом нашего анализа является официальный домен учреждения, поэтому в рейтинг включены только научные учреждения СО РАН, имеющие независимый домен. Если учреждение имеет более одного сетевого адреса, информация обо всех доменах используется в совокупности. Под доменом мы понимаем условное обозначение, служащее для индивидуализации информационных ресурсов, принадлежащих учреждению Российской академии наук в российской доменной зоне «ru» международной компьютерной сети Интернет.

Первое исследование сайтов СО РАН было проведено 8 апреля 2008 г. по формуле, которую предложили участники проекта Webometrics. Для оценки сайта измерялись четыре параметра S, V, R, Sc, где S — размер сайта, то есть количество страниц, определяемое поисковыми системами. Параметр V — видимость сайта — означает число внешних ссылок на ресурс, которое определяется поисковыми системами. Параметр R — число «мощных» файлов — означает суммарное количество файлов форматов Adobe Acrobat (.pdf), Microsoft Word (.doc) и Microsoft Powerpoint (.ppt), представленных на сайте. Параметр Sc — индекс цитирования — определялся путем суммирования документов, в которых приводятся цитаты из докладов, статей и других научных материалов. Участники проекта Webometrics использовали Google, Yahoo, Live Search и Exalead, мы же использовали Яндекс, Google, Yahoo, т.к. именно эти поисковые системы наиболее полно индексируют русскоязычную часть Интернета.

Было замечено, что определяющую роль в рейтинге играет индекс цитирования. Тогда были опробованы другие формулы, при их применении рейтинг менялся в средней части, лучшие и худшие сайты оставались на своих местах. После серии экспериментов остановились на формуле, в которой четыре параметра вносят примерно одинаковый вклад при определении места сайта в рейтинге. Рейтинг подсчитывался по формуле:

W = V + S + 2∙R + 1,5∙Sc,

где V = log10(V0), V0 = VЯндекс+VGoogle+VYahoo]/3, т.е. количество внешних ссылок на сайт определялось последовательно с помощью поисковых систем Яндекс, Google и Yahoo, а затем вычислялось среднее арифметическое;

S — среднее арифметическое количества страниц на сайте:
S = log10(S0), S0 = [SЯндекс+SGoogle+SYahoo]/3;

R — среднее арифметическое от количества PDF, DOC, PPT файлов (в сумме):
R = log10(R0), R0 = [RЯндекс+RGoogle+RYahoo]/3.

Sc — среднее арифметическое логарифмов индексов цитирования:

Sc = [log10(ScЯндекс)+log10(ScGoogle)]/2.

причем здесь использовались сведения из систем Индекс цитирования Яндекса и Google Scholar.

В таблице 1 представлены результаты анализа 30 сайтов из 80. Посмотреть рейтинг всех организаций можно на сайте ИВТ СО РАН по адресу http://www.ict.nsc.ru/ranking/.

Адреса сайтов организаций СО РАН были взяты из информационной системы «Организации и сотрудники СО РАН», размещенной на Портале СО РАН.

Легко подсчитать, что только 14 сайтов имеют число внешних ссылок более 1000. Большие сайты, у которых поисковики определяют 1000 страниц и более, у 23 организаций. Сайтов, на которых представлены документы, статьи, презентации в форматах PDF, DOC, PPT и их число более 100, — у 23 организаций. Индекс цитирования выше 1000 у 4 организаций, от 100 до 1000 у 34 организаций. В целом можно отметить, что широко известна в сети Интернет примерно одна треть научных организаций СО РАН.

Если сравнивать рейтинги от 8 апреля и 1 сентября, то можно отметить следующее. Первая десятка лучших сайтов СО РАН не изменилась. С 16-го места на 11-ое передвинулся сайт Института леса им. В.Н. Сукачева СО РАН. Произошло это за счет того, что поисковая система Яндекс стала индексировать этот сайт, возможно, сайт был зарегистрирован в Яндексе администратором. За последние месяцы на сайте появилось много новой информации, полезной для научной работы и учебы.

По параметрам, замеряемым для определения рейтинга всех учреждений, произошел рост. Для большинства сайтов рост монотонный. Поисковая система Google с апреля нашла 2 новых сайта, это сайт Института оптики атмосферы и сайт Института почвоведения и агрохимии. Только для 15 из 80 сайтов СО РАН Google определяет внешние ссылки.

Рост параметров, которые замерялись с помощью поисковой системы Яндекс, был существенней, чем у других систем. У 10 сайтов некоторые параметры выросли на порядок. Из этого следует, что администраторам необходимо прописывать сайты в поисковых системах, в различных справочниках и каталогах. Сайты ИЯФ СО РАН, ИЦиГ СО РАН, ИМ СО РАН, ИФП СО РАН и некоторых других институтов быстро развиваются, главным образом, за счет статей журналов, документов, проектов и другой информации, которая регулярно выкладывается на сайт.

Также был проведен рейтинг университетов Сибирского региона и некоторых библиотек (см. таб. 2 и 3).

Таблица 2. Итоговый рейтинг сайтов университетов Сибирского региона
от 7 июня и 1 сентября 2008 г.

Организация

www

7.06

1.09

1

Новосибирский госуниверситет

http://www.nsu.ru/

16,26

16,25

2

Томский госуниверситет

http://www.tsu.ru/

14,76

14,43

3

Алтайский госуниверситет

http://www.asu.ru/

14,30

13,41

4

Сибирский федеральный университет, г. Красноярск

http://www.sfu-kras.ru/

12,61

12,73

5

Тюменский госуниверситет

http://www.utmn.ru/

12,57

12,65

6

Иркутский госуниверситет

http://www.isu.ru/

12,24

12,08

7

Омский госуниверситет

http://www.univer.omsk.su/

11,72

11,67

8

Кемеровский госуниверситет

http://mmedia2.kemsu.ru/

11,58

11,42

9

Бурятский госуниверситет

http://www.bsu.ru/

11,59

11,36

Таблица 3. Итоговый рейтинг сайтов библиотек от 7 июня и 1 сентября 2008 г.

Организация

www

7.06

1.09

1

ГПНТБ России

http://www.gpntb.ru/

14,80

14,80

2

Российская национальная библиотека, СПб.

http://www.nlr.ru/

14,16

14,14

3

Российская государственная библиотека

http://www.rsl.ru/

13,00

12,98

4

ГПНТБ Новосибирск

http://www.spsl.nsc.ru/

12,68

12,59

5

Библиотека иностранной литературы

http://www.libfl.ru/

12,32

12,47

6

Библиотека РАН

http://www.rasl.ru/

9,03

9,26

Рейтинг библиотек и университетов не претерпел существенных изменений. Начиная с ноября ИВТ СО РАН будет периодически публиковать на своем сайте (http://www.ict.nsc.ru/ranking/) рейтинги сайтов всех институтов СО РАН.

стр. 3