Bot gromadzi dane dla Wikipedii

Sobota, 12 lipca 2008, 07:04

Bez względu na rzeczywistą jakość haseł w Wikipedii dość często bywa ona postrzegana jako niezbyt wiarygodne źródło informacji. Dobrym pomysłem wydaje się zaangażowanie do pracy nad nią środowiska naukowego. A gdyby tak stworzyć bota, który pobierałby informacje z renomowanych baz danych i przetwarzał je do formatu Wikipedii? Ideę tę z powodzeniem realizują genetycy.

Naukowcy skupieni wokół Genomics Institute of the Novartis Research Foundation zabrali się do uzupełniania Wikipedii o artykuły związane z genetyką. Co ciekawe, ich praca jest w pełni zautomatyzowana, inicjatorzy projektu wykorzystują bowiem udostępniony na licencji Apache 2.0 skrypt protein-box-bot.

Narzędzie zostało zaprojektowane do pobierania rekordów z internetowych baz danych, takich jak Entrez Gene. O zdobyte w ten sposób informacje tekstowe i wykresy (w galerii można zobaczyć przykład) w pierwszej kolejności wzbogacono 650 artykułów, opublikowanych w Wikipedii wcześniej. Powstało też 7,5 tys. zalążków haseł, które przydałoby się jeszcze rozbudować.

Jedną z ważnych funkcjonalności bota jest uzupełnianie artykułów o dane bibliograficzne (odsyłacze do fachowych publikacji, w których wspomina się interesujący nas gen). W tym zakresie skrypt wymaga dopracowania - uważa John Timmer z serwisu Ars Technica, który sprawdził, dokąd prowadzą poszczególne linki pod jednym z haseł. Jego zdaniem, tylko jedna trzecia z podanych w bibliografii tekstów zawierała istotne informacje o danym genie.

W opublikowanym na łamach PLoS Biology dokumencie twórcy projektu przyznali się, że początkowo chcieli nawiązać współpracę z konkurencyjnym dla Wikipedii serwisem Citizendium, stworzonym przez Larry'ego Sangera, współzałożyciela "wolnej encyklopedii". Citizendium, wciąż jeszcze oznaczone jako wersja beta, od pierwowzoru różni się tym, że wszyscy autorzy muszą podawać podczas rejestracji prawdziwe dane, artykuły zaś opracowywane są pod czujnym okiem ekspertów.

O przewadze Wikipedii zadecydowała jej większa popularność - inicjatorzy projektu chcieliby zainteresować genetyką jak najwięcej osób, również ze środowiska naukowego. Okazało się też, że próbując odszukać konkretną informację za pomocą Google, w 60% przypadków na pierwszej stronie wyników wyszukiwania znajdziemy umieszczone w Wikipedii zalążki artykułów, stworzone za pomocą protein-box-bota.

Anna Wasilewska-Śpioch

Wersja do druku

Poleć znajomym:

Udostępnij

Podobne tematy

Ryzyko społeczne: zagrożenia związane z robotyką przyszłości

, 14.10.2019 r.

Władze Chin zablokowały w tym kraju dostęp do Wikipedii we wszystkich językach

, 15.05.2019 r.

Botnety wydobywające kryptowalutę wróciły i infekują tysiące komputerów, generując setki tysięcy dolarów dla cyberprzestępców

, 19.09.2017 r.

Botnet Ztorg: niemal milion urządzeń mobilnych zainfekowanych w ciągu roku

, 02.06.2017 r.

Zmasowane uderzenie w botnety

, 06.06.2013 r.

Botnet wykorzystywany do generowania Bitcoinów

, 15.04.2013 r.

TOP100 najpopularniejszych haseł w polskiej Wikipedii

, 02.01.2013 r.

Microsoft pomaga w tłumaczeniu Wikipedii

, 21.10.2010 r.

Twórca Wikipedii krytykuje Wikileaks

, 28.09.2010 r.

FBI żąda usunięcia wzoru swojej pieczęci z Wikipedii

, 05.08.2010 r.

Pokaż więcej...

Starsze

11.07.2008 r.

Microsoft wyliczył koszt piractwa, 20:05

Zegarek mierzący promieniowanie UV, 15:48

Nowsze

12.07.2008 r.

Serwisy społecznościowe zagrażają bezpieczeństwu, 12:50

VIA sposobem NVIDII na Intela?, 15:36

Opinie

Redakcja nie ponosi odpowiedzialności za wypowiedzi Internautów opublikowane na stronach serwisu oraz zastrzega sobie prawo do redagowania, skracania bądź usuwania komentarzy zawierających treści zabronione przez prawo, uznawane za obraźliwie lub naruszające zasady współżycia społecznego.

Brak komentarzy. Może warto dodać swój własny?