«Наука в Сибири» № 44 (2679) 6 ноября 2008 г. О РЕЙТИНГЕ САЙТОВ НАУЧНЫХ ОРГАНИЗАЦИЙ СО РАН
В настоящее время уже не обсуждается вопрос о необходимости существования сайта научной организации, все исследовательские центры имеют официальные сайты. И, конечно, возникает естественное желание их сравнить, а затем такое сравнение использовать при развитии сайтов.
О.А. Клименко, Ю.И. Шокин
Существуют разные методы определения полноты представления организации в сети Интернет. Мы проведем анализ сайтов научных организаций СО РАН методами вебометрики.
Вебометрика (webometrics) возникла после расширения понятия «библиометрика» на веб-пространство. Библиометрика представляет собой набор методов для изучения текстов и информации, методы библиометрики включают анализ цитирования и контентный анализ. Термин вебометрика ввели Т. Алминд и П. Игверсен в 1997 г. Ими дано определение вебометрики как науки о количественных аспектах создания и использования информационных ресурсов, структур и технологий в веб-пространстве, выросшей из библиометрики и информатики.
Веб-пространство — новый тип информационного ресурса без централизованного контроля, без координированного индексирования содержания. Однако веб-пространство не является хаотической системой, в нем происходит самоорганизация в группы. Веб-пространство организуется путем взаимодействия большого числа индивидуумов и групп. Связи между разными документами устанавливаются с помощью ссылок. Изучение этих ссылок с помощью методов вебометрики позволяет определять устройство веб-пространства.
Для исследования веб-сайта используются несколько количественных параметров. П. Игверсен ввел в 1998 г. понятие Web Impact Factor (WIF). WIF — это отношение числа входящих ссылок на сайт V к общему числу страниц сайта S. Однако для определения качества сайта бывает недостаточно использовать WIF. Параметр S определяется поисковыми системами и может существенно отличаться от реального числа страниц сайта, поэтому значение параметра WIF зависит от используемой поисковой системы, от языка сайта и других факторов.
Регулярные исследования университетской и академической среды ведутся лабораторией Cybermetrics Lab, которая принадлежит Consejio Superior Investigaciones Cienthficas — крупнейшему исследовательскому центру Испании. Первоначально проект Webometrics Ranking of World Universities (далее проект Webometrics) был направлен на стимулирование веб-публикаций. Рейтинг составлялся исходя не из числа визитов и дизайна сайта, а основывался на полноте представления университета в сети. Со временем рейтинг университетов приобрел популярность, а в число организаций, которые оцениваются, были включены академические институты и научные центры. В июле 2008 г. в рейтинг 1000 научных организаций вошли Портал СО РАН (66 место) и Портал РАН (91 место).
Предметом нашего анализа является официальный домен учреждения, поэтому в рейтинг включены только научные учреждения СО РАН, имеющие независимый домен. Если учреждение имеет более одного сетевого адреса, информация обо всех доменах используется в совокупности. Под доменом мы понимаем условное обозначение, служащее для индивидуализации информационных ресурсов, принадлежащих учреждению Российской академии наук в российской доменной зоне «ru» международной компьютерной сети Интернет.
Первое исследование сайтов СО РАН было проведено 8 апреля 2008 г. по формуле, которую предложили участники проекта Webometrics. Для оценки сайта измерялись четыре параметра S, V, R, Sc, где S — размер сайта, то есть количество страниц, определяемое поисковыми системами. Параметр V — видимость сайта — означает число внешних ссылок на ресурс, которое определяется поисковыми системами. Параметр R — число «мощных» файлов — означает суммарное количество файлов форматов Adobe Acrobat (.pdf), Microsoft Word (.doc) и Microsoft Powerpoint (.ppt), представленных на сайте. Параметр Sc — индекс цитирования — определялся путем суммирования документов, в которых приводятся цитаты из докладов, статей и других научных материалов. Участники проекта Webometrics использовали Google, Yahoo, Live Search и Exalead, мы же использовали Яндекс, Google, Yahoo, т.к. именно эти поисковые системы наиболее полно индексируют русскоязычную часть Интернета.
Было замечено, что определяющую роль в рейтинге играет индекс цитирования. Тогда были опробованы другие формулы, при их применении рейтинг менялся в средней части, лучшие и худшие сайты оставались на своих местах. После серии экспериментов остановились на формуле, в которой четыре параметра вносят примерно одинаковый вклад при определении места сайта в рейтинге. Рейтинг подсчитывался по формуле:
W = V + S + 2∙R + 1,5∙Sc,
где V = log10(V0),
V0 = VЯндекс+VGoogle+VYahoo]/3,
т.е. количество внешних ссылок на сайт определялось последовательно с помощью поисковых систем
Яндекс, Google и Yahoo, а затем вычислялось среднее арифметическое;
S — среднее арифметическое количества страниц на сайте:
S = log10(S0), S0 = [SЯндекс+SGoogle+SYahoo]/3;
R — среднее арифметическое от количества PDF, DOC, PPT файлов (в сумме):
R = log10(R0), R0 = [RЯндекс+RGoogle+RYahoo]/3.
Sc — среднее арифметическое логарифмов индексов цитирования:
Sc = [log10(ScЯндекс)+log10(ScGoogle)]/2.
причем здесь использовались сведения из систем Индекс цитирования Яндекса и Google Scholar.
В таблице 1 представлены результаты анализа 30 сайтов из 80. Посмотреть рейтинг всех организаций можно на сайте ИВТ СО РАН по адресу
http://www.ict.nsc.ru/ranking/.
Адреса сайтов организаций СО РАН были взяты из информационной системы «Организации и сотрудники СО РАН», размещенной на Портале СО РАН.
Легко подсчитать, что только 14 сайтов имеют число внешних ссылок более 1000. Большие сайты, у которых поисковики определяют 1000 страниц и более, у 23 организаций. Сайтов, на которых представлены документы, статьи, презентации в форматах PDF, DOC, PPT и их число более 100, — у 23 организаций. Индекс цитирования выше 1000 у 4 организаций, от 100 до 1000 у 34 организаций. В целом можно отметить, что широко известна в сети Интернет примерно одна треть научных организаций СО РАН.
Если сравнивать рейтинги от 8 апреля и 1 сентября, то можно отметить следующее. Первая десятка лучших сайтов СО РАН не изменилась. С 16-го места на 11-ое передвинулся сайт Института леса им. В.Н. Сукачева СО РАН. Произошло это за счет того, что поисковая система Яндекс стала индексировать этот сайт, возможно, сайт был зарегистрирован в Яндексе администратором. За последние месяцы на сайте появилось много новой информации, полезной для научной работы и учебы.
По параметрам, замеряемым для определения рейтинга всех учреждений, произошел рост. Для большинства сайтов рост монотонный. Поисковая система Google с апреля нашла 2 новых сайта, это сайт Института оптики атмосферы и сайт Института почвоведения и агрохимии. Только для 15 из 80 сайтов СО РАН Google определяет внешние ссылки.
Рост параметров, которые замерялись с помощью поисковой системы Яндекс, был существенней, чем у других систем. У 10 сайтов некоторые параметры выросли на порядок. Из этого следует, что администраторам необходимо прописывать сайты в поисковых системах, в различных справочниках и каталогах. Сайты ИЯФ СО РАН, ИЦиГ СО РАН, ИМ СО РАН, ИФП СО РАН и некоторых других институтов быстро развиваются, главным образом, за счет статей журналов, документов, проектов и другой информации, которая регулярно выкладывается на сайт.
Также был проведен рейтинг университетов Сибирского региона и некоторых библиотек (см. таб. 2 и 3).
Таблица 2. Итоговый
рейтинг сайтов университетов Сибирского региона от 7 июня и 1
сентября 2008 г.
№
|
Организация
|
www
|
7.06
|
1.09
|
1
|
Новосибирский госуниверситет
|
http://www.nsu.ru/
|
16,26
|
16,25
|
2
|
Томский госуниверситет
|
http://www.tsu.ru/
|
14,76
|
14,43
|
3
|
Алтайский госуниверситет
|
http://www.asu.ru/
|
14,30
|
13,41
|
4
|
Сибирский федеральный университет,
г. Красноярск
|
http://www.sfu-kras.ru/
|
12,61
|
12,73
|
5
|
Тюменский госуниверситет
|
http://www.utmn.ru/
|
12,57
|
12,65
|
6
|
Иркутский госуниверситет
|
http://www.isu.ru/
|
12,24
|
12,08
|
7
|
Омский госуниверситет
|
http://www.univer.omsk.su/
|
11,72
|
11,67
|
8
|
Кемеровский госуниверситет
|
http://mmedia2.kemsu.ru/
|
11,58
|
11,42
|
9
|
Бурятский госуниверситет
|
http://www.bsu.ru/
|
11,59
|
11,36
|
Таблица 3. Итоговый
рейтинг сайтов библиотек от 7 июня и 1 сентября 2008 г.
№
|
Организация
|
www
|
7.06
|
1.09
|
1
|
ГПНТБ России
|
http://www.gpntb.ru/
|
14,80
|
14,80
|
2
|
Российская национальная библиотека,
СПб.
|
http://www.nlr.ru/
|
14,16
|
14,14
|
3
|
Российская государственная библиотека
|
http://www.rsl.ru/
|
13,00
|
12,98
|
4
|
ГПНТБ Новосибирск
|
http://www.spsl.nsc.ru/
|
12,68
|
12,59
|
5
|
Библиотека иностранной литературы
|
http://www.libfl.ru/
|
12,32
|
12,47
|
6
|
Библиотека РАН
|
http://www.rasl.ru/
|
9,03
|
9,26
|
Рейтинг библиотек и университетов не претерпел существенных изменений.
Начиная с ноября ИВТ СО РАН будет периодически публиковать на своем сайте
(http://www.ict.nsc.ru/ranking/) рейтинги сайтов всех институтов СО РАН.
стр. 3
|