Уикипедия:Бот/Задачи/Архив/2019
Оправяне на интервали
Изтърках си клавиатурата да чета книги по 300 страници и да копирам изречения, в статията Стара мома. Някой може ли да оправи двойните интервали и орфографията автоматично, където съм пропуснал? Благодаря, → Иван (беседа) 23:41, 18 февруари 2019 (UTC)
- Иван, в Настройки, Джаджи, си включете „Съветник (Advisor)“, който помага именно за оправяне на двойните интервали и други такива редакции. --Rumensz (беседа) 07:46, 19 февруари 2019 (UTC)
- Благодаря. → Иван (беседа) 00:03, 20 февруари 2019 (UTC)
закратко -> за кратко
Тази думичка се среща в десетки страници а в правописния речник няма такава. За разлика от „накратко“ „за кратко“ винаги се пише отделно. -- Сале (беседа) 09:36, 11 април 2019 (UTC)
- 174 променени.--Vodnokon4e (беседа) 14:59, 25 април 2019 (UTC)
hit.bg
[1] - сайтът на работи от 2015, всички връзки към него са мъртви, а повечето сайтове са и напълно изгубени. --Спас Колев (беседа) 10:49, 22 април 2019 (UTC)
- Подкрепям. Преди време повдигнах темата, тогава контра аргумент беше, че много статии щели да останат без източници. Крайно време е линковете да се махнат.--GVF (беседа) 17:51, 22 април 2019 (UTC)
- Ами просто се добавя - „(мъртъв линк)“ и всичко е наред с източниците. --Rumensz (беседа) 18:21, 22 април 2019 (UTC)
- Това, което видях, не бяха източници, а главно допълнителни външни препратки. --Спас Колев (беседа) 11:41, 23 април 2019 (UTC)
- Не мота да я разбера тази работа с мъртвите линкове. Какъв смисъл има на съществуват? Сполед мен – никакъв. Особено в случая, когато знаем, че сайта го няма, няма и да го има.--GVF (беседа) 16:32, 24 април 2019 (UTC)
- Ами просто се добавя - „(мъртъв линк)“ и всичко е наред с източниците. --Rumensz (беседа) 18:21, 22 април 2019 (UTC)
Хм, това чак сега го видях. Да разбирам ли, че всичките линкове с hit.bg са за премахване? Да търся ли в Wayback Machine или на друго място или направо да ги махам?--Vodnokon4e (беседа) 18:57, 24 април 2019 (UTC)
- Възможно ли е автоматично търсене/свързване с archive.org? Голяма част от връзките са за махане, но вероятно има и такива, които си струва да се запазят. --Спас Колев (беседа) 11:36, 25 април 2019 (UTC)
- Не, поне при мен не с pywikibot. Знам, че има скрипт за някакъв интернет архив бот (в английската съм го виждал да променя препратки автоматично), но не го знам къде е. При мен единствено съм успял засега да направя бота да открива мъртви линкове и да ги посочва на беседите (не съм го пускал това, за да не пълня излишно беседите на статиите.). Но не съм открил как да го свържа направо с archive.org.--Vodnokon4e (беседа) 12:12, 25 април 2019 (UTC)
- Какъв е смисълът да се пазят външни препратки към сайтове, които не съществуват вече 5 години? Ако авторът на дадена сайт не си е направил труда да го премести другаде откакто е спрян hit.bg как архивното копие в archive.org или където и да е отговаря на изискванията за благонадеждност на източниците? -- Сале (беседа) 08:52, 7 май 2019 (UTC)
- Не, поне при мен не с pywikibot. Знам, че има скрипт за някакъв интернет архив бот (в английската съм го виждал да променя препратки автоматично), но не го знам къде е. При мен единствено съм успял засега да направя бота да открива мъртви линкове и да ги посочва на беседите (не съм го пускал това, за да не пълня излишно беседите на статиите.). Но не съм открил как да го свържа направо с archive.org.--Vodnokon4e (беседа) 12:12, 25 април 2019 (UTC)
- Готово 1/4 - ръчно, че повече ме домързя постоянно да променям регулярните изрази. Мисля, че сега останаха само беседите, потр. страници. В основното няма.--Vodnokon4e (беседа) 22:59, 8 май 2019 (UTC)
Дати и месеци
Гледам, че някои слагат смешни вътрешни препратки от рода на [[13]] [[април]]. Могат ли да се премахнат с бот? --Rumensz (беседа) 09:26, 5 юни 2019 (UTC)
- Готово 158 + десетина на ръка.--Vodnokon4e (беседа) 16:05, 29 декември 2019 (UTC)
Правопис
Тотално се затрупах, докато се опитвам да оправям елементарни правописни грешки, като тези с пълен член са неизброими, тук посочвам само някои:
- сгрешено > вярно
- в главният > в главния
- от основният > от основния
- на следващият > на следващия
- от следващият > от следващия
- през следващият > през следващия
- в следващият > в следващия
- със следващият > със следващия
- състой > състои
- свойте > своите
- смърта > смъртта
- пролета > пролетта
- четери > четири
- своят > своя
- съ-император > съимператор
- всъшност > всъщност
- помоща > помощта
- ноща > нощта
- ефективноста > ефективността
- способноста > способността
- повърхноста > повърхността
- дейноста > дейността
- крепоста > крепостта
- скороста > скоростта
- постояно/и/а > постоянно/и/а
- съши, съшия, съшият, съшите, съшо, съшото съшата > 'щ'
- устроиство/а > устройство/а
- въстановен > възстановен
Xunonotyk (беседа) 15:23, 22 ноември 2019 (UTC)
- Подкрепям. Добре е периодично (веднъж месечно?) тия грешки да се поправят автоматично. GVF (беседа) 17:31, 22 ноември 2019 (UTC)
- „своят“ има валидни употреби (като „той е своят най-голям враг“). --Спас Колев (беседа) 14:26, 25 ноември 2019 (UTC)
- принципно е възможно, но в по-художествен текст, по-лесно е да се прегледат редакциите на бота за единични случаи, от поправянето на грешките ръчно. --Xunonotyk (беседа) 20:29, 25 ноември 2019 (UTC)
- От опит бих могъл да кажа, че подобни промени (като „своят -> своя“) само с регулярни изрази са вкарване на таралеж в гащите. Измислянето на подходящия регулярен израз, който лесно може да се окаже невъобразимо сложен дори за разбиращи от изразите, вече е достатъчно натоварващо. Когато накрая евентуални, и често неизбежни грешки на бота бъдат изкарани през носа на пусналия го, това рядко има особено насърчаващ ефект. Мога да посоча поне няколко имена на хора, които повече или по-малко се махнаха от Уикипедия, след точно такива опарвания.
- Тъй като в случая има нужда от някаква по-комплексна, „интелигентна“ преценка, по-скоро може да е удачно да се използва машинно самообучение. Убеден съм, че ИИ би могъл да се справя с подобни поправки в Уикипедия не по-зле от човек (просто това вече се прави на други места), но може би най-ключово за мен би било друго. Ако бот с ИИ прави грешки, но грешките като количество и качество са съпоставими с тези на редактор човек, то ботът не следва да бъде третиран по-различно от такъв редактор човек. Включително и ако ботът „не желае“ да отговаря на критични бележки – нещо, което е норма тук.
— Luchesar • Б/П 16:41, 26 ноември 2019 (UTC)
- Просто се чудя кое е по-малкото зло. Слагането на пълен член на поразия или пропускането му понякога. Ако направиш алгоритъм за корекции на пълен член след десетината предлози ще вдигнем нивото в пъти. А "своят" ще бъде засегнат и оправен също. Последните няколко дни пусках търсене с комбинация от най-честите предлози и прилагателни и винаги излизат доста страници. Например: за, от, в, на, с, през + десният, левият, обратният, същият, другият, първият, последният, новият, старият, основният, неговият …--Xunonotyk (беседа) 17:03, 26 ноември 2019 (UTC)
- принципно е възможно, но в по-художествен текст, по-лесно е да се прегледат редакциите на бота за единични случаи, от поправянето на грешките ръчно. --Xunonotyk (беседа) 20:29, 25 ноември 2019 (UTC)
- Готово, около 450. Без "свойте", "свойта" - има ги в цитати.--Vodnokon4e (беседа) 19:58, 29 декември 2019 (UTC)
Правопис 2
Нов ужас с над 300 страници, явно копирано грешно:
- на водосборният басейн
- от водосборният басейн
- във водосборният басейн
Една седмица редактирам реки и днес видях, че няма да стане скоро.--Xunonotyk (беседа) 09:03, 5 декември 2019 (UTC)
- Готово 305.--Vodnokon4e (беседа) 17:18, 29 декември 2019 (UTC)
Бот вместо Advisor
Моля някой програмист да прегледа правилата на Advisor и да напише бот, който веднъж седмично да ги прилага автоматично. Върху статиите създадени и/или редактирани след последния път, когато ботът е работил. Е, първия път ще трябва върху всички, но е еднократен проблем. Полезно е (бих дискутирал защо)!!! Знам какво приказвам – вижте ми приносите GVF (беседа) 17:20, 6 декември 2019 (UTC)
Грешка в "така наречените"
Съчетанието "на т.н.", изписано така значи "на така нататък". Има 186 срещания, които трябва да се сменят на "на т.нар". Също и с предлозите: към, за, от, при, в (и каквото се сетите още). --Xunonotyk (беседа) 08:02, 19 декември 2019 (UTC)
- Готово. 194. Не зная откъде ботът намери още 7, при условие, че първото ми търсене показа 187.--Vodnokon4e (беседа) 07:27, 30 декември 2019 (UTC)
- + ~ 250 за "към, за, от, при, в" т.н.--Vodnokon4e (беседа) 10:20, 30 декември 2019 (UTC)
Към днешна дата
На много места е използвано вестникарското „към днешна дата“, „към момента“ и пр., което не е енциклопедично. Може би един „списък“ с подобни изрази за преоценка не е излишен. --Rumensz (беседа) 17:56, 22 декември 2019 (UTC)
- Rumensz: Май няма нужда от бот за това, вграденото търсене върши по-добра работа: [2], [3]. --Спас Колев (беседа) 09:10, 25 декември 2019 (UTC)