Обсуждение:Hacknowledge 2019
Примеры идей
[править]- Для того, чтобы сподвигать читателей википедии становится её авторами, мы подсвечиваем красным цветом ссылки на несуществующие статьи. В частности, так делается и в карточках статей, автоматически наполняемых из викиданных (см. например первооткрыватель NGC 989). В элементе викиданных, соответствующем красной ссылке (d:Q520937 для нашего примера), зачастую содержится немало информации. И если бы удалось изложить её литературным русским языком, получилась бы годная заготовка статьи. Технический механизм подстановки текста для отсутствующих статей работает (кликните на красную ссылку в карточке NGC 989). Однако в нынешнем виде его полезность весьма сомнительна, требуется сторонний веб-сервис, который «переведёт» содержимое элемента викиданных на русский язык и оформит текст в соответствии с руководством Википедия:Оформление статей.
- Wikidata game — это интересный пример «казуализации» википедии. Для того, чтобы написать статью в ру-вики, нужно переварить принятые в сообществе правила, а также найти и прочитать кучу источников. Для того, чтобы из текста вики-статьи сформулировать полноценное утверждение в викиданных, достаточно лишь иметь базовую языковую и компьютерную грамотность. Последовавшая за ней wikidata distributed game представляет собой целый framework для создания игр, но как и любой инструмент, она накладывает довольно серьёзные ограничения на возможные сценарии игр. Например есть сотни элементов викиданных о людях с изображением, но без указания пола или тысячи элементов о людях, но без информации о цвете глаз.
- Практически любой произвольный запрос типа «перечислить уроженцев Санкт-Петебруга, в честь которых назван топоним в Санкт-Петербурге» возвращает дай бог 10 % информации от того, что уже есть в неструктурированном виде в википедии. Существует несколько инициатив по выгрузке в викиданные полуструктурированной информации, в частности из карточек или категорий статей. Но, например, информация о том, что Равшана Куркова была супругой Артём Ткаченко есть только в тексте в неструктурированном виде. Именно там сосредоточен самый большой массив информации, который было бы интересно загрузить в викиданные. В качестве одной из обозримых вариаций этой задачи можно рассмотреть возможность формулирования критериев включения статей в категории. Например, люди, включенные в Категория:Тангутологи должны в викиданных иметь род занятий тангутолог.
- создание аналога кинопоиска (привет, Яндекс!) и/или навигации по научным статьям (привет разные базы данных, mathnet или math genealogy)
- родословное древо: динамическая визуализация данных через JavaScript в браузере аля родовод
- выделение данных о пользователе по его правкам и поиск "уток"
Два основных направления:
- Упаковка - проекты, основанные на общественном достоянии (пример можно посмотреть здесь);
- Функционал - проекты, обеспечивающие интеграцию разных проектов и ориентирование в массивах открытого контента (примеры можно посмотреть здесь и здесь).
Первая группа проектов должна быть основана на использовании контента проектов Викимедиа, Ноосферы, открытых библиотек и архивов (в целом любых). Результатом, условно говоря, могут быть чат-боты, которые позволяют получить нужный контент, стриминг на основе того, что где-то лежит, тематические пополняемые библиотеки контента, приложения, которые так или иначе интегрируют части произведений в ОД и т.п. Цель - сделать для открытого контента упаковку, которая повысит интерес к нему со стороны пользователя.
Вторая группа проектов должна интегрировать материалы нескольких платформ, упрощать поиск по массивам контента, адаптировать его для пользователя. Здесь важны в первую очередь решения по каталогизации произведений, приведению в единообразный вид метаданных, их обогащению, переводу, дополнению ссылками на копии произведения в интернете, приведению в порядок и конвертации в удобные форматы файлов произведений в ОД, сбору открытого контента на просторах сети и т.д. Цель: найти решения (точнее, их прототипы) для повышения эффективности и функциональности Ноосферы.
- Задача: Разработать инструмент оперативного отслеживания ошибочного проставления дат смерти в Викиданных.
- Обоснование: В проекте Викиданные нередки случаи добавления ошибочной даты смерти ныне живущей персоны, после чего она появляется в Википедии и в интернет-поисковиках. Малоопытным участникам Википедии трудно понять, как это исправить, и в википедийных списках наблюдения по умолчанию правки Викиданных не отображаются. По этой причине дата смерти может висеть несколько дней. Подобные случаи неоднократно привлекали внимание СМИ, что негативно сказывается на репутации Википедии и поисковиков.
- Постановка задачи:
- 1. Создать в русской Википедии страницу "Википедия:Недавно проставленные даты смерти из Викиданных".
- 2. На этой странице публиковать таблицу, содержащую элементы Викиданных о людях, где была добавлена дата смерти в течение последних 7 дней.
- 3. Публиковаться должны только те элементы Викиданных, для которых существует статья в русской Википедии.
- 4. Проверяться на предмет добавления даты смерти должны только элементы Викиданных, созданные не менее месяца назад.
- 5. Таблица должна оперативно обновляться (желательно не реже чем раз в 10 минут).
- 6. Таблица должна содержать следующие столбцы: "Элемент Викиданных", "Статья Википедии", "Дата рождения", "Дата смерти", "Время правки", "Кем внесена информация".
- 7. Должна быть возможность сортировки по всем столбцам. Новые записи должны быть сверху.
- Пример заполнения таблицы:
# | Элемент Викиданных | Статья Википедии | Дата рождения | Дата смерти | Время правки | Кем внесено |
---|---|---|---|---|---|---|
1 | no label (Q999999999) | Иванов, Иван Иванович | 01.01.1971 | 05.10.2017 | 11:11, 30 апреля 2019 | 123.456.78.90 |
2 | no label (Q987654321) | Петров, Пётр Петрович | 12.01.1989 | 27.04.2019 | 19:56, 29 апреля 2019 | 193.233.42.76 |
3 | no label (Q123456789) | Сидоров, Сидор Сидорович | 01.01.1999 | 29.04.2019 | 13:25, 29 апреля 2019 | Andreykor |
Темы выступлений
[править]- Как перестать бояться и начать (массово) править викиданные? 15-20 минутный workshop, включающий в себя написание несложного SPARQL-запроса, очистку/обработку данных в экселе и заливку через quickstatment. Спикер, 5М правок в викиданных --Ghuron (обсуждение) 07:14, 5 апреля 2019 (UTC)