ЖЖ — космические недоумки Вторник, Апр 15 2008 

Сейчас мы будем гнобить СУП, не правда ли, детка?

В ЖЖ есть похвальная возможность логиниться через OpenID. То есть я, не заводя аккаунта на ЖЖ, могу комментировать как не-совсем-аноним (от имени своего wordpress-овского или ярушного дневника), меня даже можно добавить в друзья. Это чудесно. Но ещё мне дозволено настраивать профиль. Это сказка!

Круто, я выставил себе кастомное имя, дату рождения. Даже аватарку, если захотел. (Попутно порадовался такой возможности: «показывать день рождения» — «всем», «формат отображения дня рождения» — «не отображать».) Настроил видимость своего емейла, который не указан. Выбрал стиль дневника. Дал ссылку на свой сайт (зачем? мой OpenID и так является ссылкой на сайт). Стоп. Задумался. Какой такой стиль дневника? У меня же нет дневника!..

Ладно, едем дальше. Указал страну, штат («Санкт-Петербург»), город. Сохранил.

Добро пожаловать в Живой Журнал! Теперь у вас есть аккаунт: http://ext-37124.livejournal.com/.
По адресу было выслано письмо с дальнейшими указаниями. Перейдите по ссылке в этом письме, чтобы завершить регистрацию.

(см. скриншот)

Один. Дневника по ссылке не существует («This user has no journal here.»). Два. Никакого письма никуда не выслано — потому что никакого адреса я не указывал (видимо, поэтому и возникла прекрасная формулировка «по адресу было выслано письмо»). Ну и далее: предложенное тут же «отправьте свою первую запись», разумеется, не работает:

Пользователи, у которых нет аккаунтов в ЖЖ, не могут писать записи. У них здесь нет журналов и писать им некуда. Впрочем вы можете комментировать чужие журналы.

Зато работает «настройте вид своего журнала более тонко» (я выбрал себе какой-то изящный шаблончик), а также, разумеется, мне предложили перейти на платный аккаунт.

Позор Носику, пьянице и тунеядцу. И всё такое.

Реклама

Спамеров в баню Четверг, Янв 31 2008 

Как поступать с человеком, который формально не нарушает правила сервиса, но пользуется им не так, как нам хотелось бы? Речь, понятное дело, о тех, кто использует Ярушку в спамерских целях — для раскрутки своих спам-блогов, наращивания PageRank и т.д. С одной стороны, бороться с ними надо, чтобы сервис не превратился в спамопомойку. С другой стороны, приобрести репутацию тиранического и волютаристского блогхостера, который банит направо и налево, тоже не здорово.
(далее…)

Скобла не замай! Воскресенье, Янв 6 2008 

Интересно вдруг разгорелись споры об информации в социальных сетях — кто ею владеет. Сначала Скобла забанили на Фейсбуке, потому что он выкачивал контактные данные своих «френдов», потом ему же ещё и наваляли со всех сторон — основным аругментом используя то, что, мол, «не для того тебя, Скобель, люди френдили, чтоб ты их адреса потом спамерам продал«. И это всё на фоне разговоров о том, как надо бы нам создавать средства межсервисного френжения.
(далее…)

Братья простоватые Четверг, Дек 6 2007 

…А нашему брату сколько ни тверди про кровавую гэбню, всё в одно ухо влетает, в другое вылетает. Сколько уже мусолили, что ФКонтакт построен на деньги силовиков, чтобы собирать досье и компромат на сограждан, а им хоть кол на голове теши. Вот, опять: зазывают поделиться, кто за кого голосовал (ссылка требует логина, наверно). Больше двух тыщ уже высказалось.

И ещё, многие, наверно, не понимают, что в Сети тайного голосования не бывает. Если ты участвуешь в опросе, то вполне возможно, что информация о твоём выборе сохранится не только как плюс-один в общем результате, но и останется конкретно привязана лично к тебе. Тем более, если ты голосуешь на сервисе, где логин очень качественно ассоциируется с живым человеком.

Во время и после выборов на множестве форумов и сервисов проводятся такие опросы. Мне кажется, это не очень хорошая идея — призывать всех подряд в них участвовать. Выборы у нас всё-таки тайные. Одно дело — если человек активно общается на политические темы, высказывает своё мнение здесь и там: ему стесняться нечего — в любом случае не скроется. И другое — всех подряд зазывать: «заходи, проголосуй». Люди вообще бывают легкомысленны в Сети, и дополнительно провоцировать их на ненужные политические риски — дурное дело.

Аргументация «а чего нам бояться, имею право голосовать, за кого хочу», к сожалению, силы не имеет. Как известно, многих уже принуждали на прошедших выборах голосовать «за кого надо», шантажируя работой, зарплатой, стипендией и т.д. Поиск нелояльных по Сети тоже может начаться в любой момент. Будьте бдительны!

Дополнительное чтение, не совсем по теме, но тоже про выборы: Т.О. делится впечатлениями и соображениями.

Путин — это наше навсегда Понедельник, Дек 3 2007 

Ну что ж, адская машина сделала своё дело. Как «выясняется», среди всех электорально активных россиян только два с половиной процента голосуют за демократов. Не правда ли, удивительно? Все раздали, сколько обещали. Может быть, пора, наконец, отделить Питер и, прихватив Карельский перешеек, присоединиться к Финляндии?

А пока можно только укрыться в виртуальности, которая, как известно, голосует за СПС, и там предаваться скорби и оппонированию власти. Впрочем, сегодняшняя горячая новость состоит в том, что большинство российских блоггеров, как все давно ждали, окончательно попадает под контроль кровавой гэбни и лично Антона Борисовича Н. Если, конечно, он не соскочит раньше, как ещё в июне предсказывал Вербицкий.

Выборы — выборами, а страна держится на тех, кто работает, кормит себя и семью, строит дома, дороги и интернет-сервисы. За работу, сукины дети! Пока не отправили в Сибирь снег убирать…

Чтобы всех отыскать, воедино созвать… Пятница, Ноя 2 2007 

Блогосферные новости недели: в России — Яндекс запускает поиск по комментариям, в мире — Google анонсирует OpenSocial, открытое API для социальных сервисов.
(далее…)

Blogowar и статистика WordPress Среда, Окт 24 2007 

…И всё-таки даже мне перепало от блоговарских щедрот.

Как всякий порядочный блоггер, не могу удержаться и не заглянуть время от времени в статистику и рефереры. Сегодняшние показания впечатляют. Рекордное количество просмотров, похоже, сегодня состоится (что-то около двух сотен, при среднем в районе двадцати). Но это-то ладно. Смешно, что на русской морде сервиса мой блоговарный пост висит сейчас на втором месте в списке «Hot Posts», сразу после загадочного узбекистанского лидера.

То, что узбеков на вордпрессе считают русскими — ладно. Яндексовый поиск по блогам тоже частенько принимает болгаров за своих. Меня больше удивляет, как пост с жалкими 75 хитами оказывается на втором месте, если всего, как они пишут, 1,691,905 blogs with 57,383 new posts today. Понятно, что эти полтора миллиона и эти шестьдесят тысяч принадлежат разным языкам и национальностям, но всё-таки странно.
(далее…)

Война блогов — или ну её? Среда, Окт 24 2007 

По выходным я за комп не сажусь, народных забав избегаю, да и вообще тяжёл на подъём. Однако ж, как не написать о блоговарзе…

Тот самый Смирнов, великий и ужасный, который ещё недавно нудил в мой адрес, что я, мол, толку кисель в ступе на тему «блогосфера как MMORPG», на выходных взорвал мозг рунета, запустив блогоигру BlogoWar. Правила желающие могут прочитать сами.

Как это я ловко ввернул про себя, как будто Дима вдохновился моими идеями! Теперь можно заявить: «ну конечно, я не считаю, что Дима вдохновился моими идеями» — всё равно никто не поверит. Так вот — я, конечно, не считаю,.. и т.д.

Вопрос, который меня беспокоит вот уже второй день — прав ли я, что не участвую в этом шабаше? Собственно, есть два препятствия. Во-первых, у нас, советских, собственная гордость. Считается, что я не ищу дешёвой популярности, мне не нужен дутый трафик, я не монетизируюсь и пр. Во-вторых, банально лень и некогда — писать однострочные посты я не хочу (с ярушки играть нельзя), а серьёзными постами, которые отнимают часа по полтора, много не навоюешь. Тем более, надо ж успевать ещё и читать что-то.
(далее…)

Баянофильтратор против баянотранслятора Среда, Окт 17 2007 

Кабы я смотрел футбол, так и написал бы о футболе. Но вместо того, чтобы сидеть у телевизора, я протупил в монитор, и поэтому остаётся написать про что-нибудь интернетовское. Давайте порассуждаем о баянах…

Последние дни меня всё мучает мысль о создании противобаянового фильтра. Тем более, что работа в Яндексе открывает в этом смысле огромные перспективы: весь проиндексированный интернет где-то рядом, на соседнем винчестере. Но призадумаешься, и поймёшь, что это дело непростое.

Насчёт оценить сходство двух документов — тут, понятно, есть мировые наработки. Сложнее, мне кажется, провести грань между баяном и просто распространённой информацией. Допустим, таблицу ASCII-символов или гимн Советского Союза можно найти в тысячах мест, но баяном они от этого не становятся. Потом, баян часто возникает в контексте. Фраза «мотороллер не мой» может иной раз быть совершенно невинной, а уж известное шуточное объявление «снимаю, порчу» вообще построено на пунктуации, которую поисковые механизмы обычно игнорируют. И в-третьих, всякий баян надо увидеть когда-нибудь в первый раз. Поэтому фильтр не может быть полностью отделён от пользователя: он должен знать, какие баяны, по первости, дозволять.

Конечно, нужно учитывать пути распространения баянов. Они плодятся в блогосфере, на развлекательных сайтах и форумах, передаются через аську и по почте. Наоборот, баян, лежащий в какой-нибудь википедии, таковым считаться, скорее всего, не должен (можно вешать дисклеймер: «все бояны, размещённые на этом сайте, опубликованы в образовательных целях, и не предназначены для дальнейшего использования«). Логичным приложением баянофильтратора была бы защита RSS-агрегаторов (той же Яндекс.Ленты) и лент друзей в блог-системах. Серьёзную проблему представляют медиабаяны — фотожабы и аудиоприколы. Опять-таки, нельзя забывать, что баяны часто передаются по ссылке, и их надо по возможности отсекать уже на этой стадии.

Кажется, что проблема фильтрации баянов близка к защите от спама, но есть существенные отличия. Во-первых, «правило первого баяна», далее ППБ (оно же: «один раз — не баян»), очень осложняет фильтрацию, поскольку требует учёта истории конкретного клиента (это особенно просто реализовать в агрегаторах, хотя, в отличие от клиентских приложений, они смогут обеспечить только частичную защиту). Во-вторых, невозможны белые и чёрные списки (белые — потому что баянами балуются даже лучшие друзья; чёрные — в основном из-за ППБ). В-третьих — потому что сравнение документов должно быть одновременно и куда более жёстким, поскольку баян от не-баяна может отличаться сколь угодно мало (вплоть до запятой, как показано выше), так и более гибким (например, две ключевые строки из пятистраничного баяна тоже должны успешно перехватываться). Тут нужны очень чуткие алгоритмы.

Какие ещё возможны подходы? Вот идейка, опять же, для агрегаторов. Рассмотрим, например, Google Reader, используемый в режиме «List View», когда каждую запись надо отдельно разворачивать, и на мониторе всегда развёрнуто не более одной записи. Софт может учитывать время, потраченное пользователем на прочтение конкретной записи, и количество текста в ней. Если скорость прочтения существенно выше средней (средней для конкретного пользователя, конечно — у разных людей она может очень сильно отличаться), значит, это либо известный баян, либо просто скучное сообщение. Если у многих читателей «мнение» совпадает, значит, сообщение в самом деле не супер, и другим его можно уже не показывать. Проблема тут одна: пока будем собирать статистику, запись уже всё равно уйдёт в историю. Однако если агрегатор, как GReader, принадлежит поисковику или крупному порталу, эту статистику можно использовать позже — например, в ранжировании поисковой выдачи.

Если не хочется бороться с баянами, можно их исследовать. Простейшая идея — попробовать построить граф распространения отдельного баяна по интернету, как он блуждает с сайта на сайт. Очевидная трудность тут в том, что многие воруют без ссылок на оригинал. Кроме того, баяны мутируют и видоизменяются, поэтому проследить их программно довольно сложно. По крайней мере, можно исследовать кривую распределения моментов копирования баяна. поскольку получить более или менее адекватные данные о времени публикации того или иного документа всё-таки реально. Любопытно было бы узнать, сколько времени проходит от создания баяна до пика его популярности? И каков период полураспада?..

Ну и в идеале, конечно, надо написать Универсальный Баяногенератор и встроить его в Я.Ру, чтоб обеспечить стабильный приток траффика.

В час, позади Люксембургского дворца! Среда, Окт 3 2007 

Такое оскорбление можно смыть только кровью. В ответ Смирнову — Марии Христос.

Я, Дима, в «Команду Друзей» не пишу, и рассматривать мои приватные писульки как отмазки от команды разработчиков не предлагаю. Это вполне частный дневник, где я пишу, что думаю (за вычетом того, чего писать не положено), с проектом и с компанией формально не связанный.

Про «кривость», кстати, я и не говорил. Баги — есть, фичи недостающие — не достают, так на то и бета. We call it «beta» ’cause it’s betta’ than nothing, не так ли? А какой-то принципиальной кривизны я в проекте не вижу. Если ты видишь — твоё право. Можешь об этом и написать, а не на мои «отмазки» кивать. Вот будет топовый пост в рейтингах:

Дмитрий Смирнов Разоблачает Создателей Я.Ру: Кривые руки или Мозговой Слизень?

Кстати, не первый раз уже замечаю: на Я.Ру ты вполне тактично себя ведёшь, грубого слова не скажешь, а на своих внешних блогах обидно выражаешься. Ведь, право слово, меня ругать — не Носика с Экслером, славы не прибавится.

P.S. К тому же, я до сих пор не стал ставить латинические slug-и, приходится унижаться до кривых ссылок на Я.Ру, да?

Следующая страница →