Тэсцім фразеалагічны слоўнік

Вітанкі, я тут тэсцірую прасунуты пошук па тэксце і патрэбны фідбэк ад тых, каму гэта будзе цікава.
Пошук будзе шукаць па ўсіх словаформах, напрыклад, запыт “хацець есці” знойдзе варыянту “хачу есці”, “хоча есці”, “хоча ела” і знойдзе ўсе тэксты дзе хаця б адно з гэтых слоў сустракаецца.

Для тэсту дадаў слоўнік фразеалагізмаў:
І.Я. Лепешаў — Этымалагічны слоўнік фразеалагізмаў 2004 год:

У слоўніку раскрываецца гісторыя і паходжанне каля 1750 фразеалагізмаў сучаснай беларускай літаратурнай мовы, паказваецца сувязь іх сучаснага і першапачатковага, этымалагічнага значэння, жыццё фразеалагізмаў y часе і прасторы. Тут аб’яднаны раней апублікаваныя пад такой жа назвай выдавецтвам «Народная асвета» (1981,1993) дзве часткі слоўніка, a таксама новыя гістарычна-этымалагічныя даведкі да больш як 400 фразеалагізмаў.

Паспрабаваць можна тут.

Пішыце пра глюкі-багі, буду выпраўляць

3 Likes

Пакуль уражанні толькі пазітыўныя, адзінае што, у кожным артыкуле пасля самога фразеалагізма, выдзеленага тлустым, не хапае прабела

1 Like

Можаш расказаць у дэталях, як ты зрабіў такі пошук, што здольны зразумець словаформы?


  1. кнапулька справа паехала ўніз.

  2. Я як юзэр хачу бачыць хоць нешта на экране. А яно мне кажа, што поле не можа быць пустым.
    Я б хацеў, каб мне паказваліся рандомныя запісы, калі поле для ўвода пустое.

1 Like

Сапраўды, рандомны фразеалагізм — крутая штука.

2 Likes

Дакладнае супадзенне вылучаць зялёным колерам (як зараз), недакладнае супадзенне (іншыя словаформы) вылучаць іншым колерам (шэрым?).
Зрабіць два блокі вынікаў: спачатку паказваць самі фразеалагізмы (у якіх ёсць патрэбнае слова), потым паказваць артыкулы (з запытам карыстальніка). У кожным блоку спачатку паказваць дакладныя супадзенні, потым недакладныя.

Умоўна:
Блок 1. Фразавая частка. Фразеалагізмы з патрэбным словам. Спачатку дакладныя супадзенні ў алфавітным парадку (фразеалагізмаў), потым усе астатнія таксама ў алфавітным парадку.
Блок 2. Тлумачальная частка. Калі патрэбнае слова ёсць у тэксце артыкула (і прыбраць паўторы з фразавай часткі). Спачатку дакладныя супадзенні, потым недакладныя.

1 Like

А калі мы шукаем пра некалькіх словах?

Тое самае: спачатку фразавая частка, потым тлумачальная.

1 Like

Калі коратка, то спампаваў граматычную базе, запіхнуў у базу даных і ў тэксце кожнае слова праганяю праз таблічку са словамі і захоўваю для кожнага слова бацькоўскія формы (бо іх можа быць некалькі, як дамЫ і дАмы). А пасля ўжо шукаю па гэтых формах.

Блок 3. “Кавалкі”. Калі тэкст шукаецца адным кавалкам (як ёсць). Напрыклад: чалавек набіраў “яблык”, а набраў “яблы”. Паўторы з блока 1 і з блока 2 прыбраць.
У такім выпадку кавалак (=запыт цалкам) можна вылучаць якім-небудзь жоўтым колерам.

Шырыня сайта на кампе не павінна быць больш за 800 пікс.
Словы, якія пачынаюцца на “у” або “ў”, трэба шукаць адначасова і з “у”, і з “ў”.

1 Like

Калі шукаеш “руск”, вылучае “беларускі” і “старабеларускі” - ???

1 Like

@Arciom мае папяровы слоўнік і ў яго цэлая сістэма, як шукаць той ці іншы фразеалагізм. Мо трэба будзе дадаваць нейкія тэгі або групаваць неяк артыкулы?
Фразеалагізм можа быць пра ляноту, але ў тлумачэнні толькі слова “гультайства” або “лянівы”. Шукаючы “ляноту”, не знойдзем такі фразеалагізм. Дадаць тэг #лянота?
Трэба больш прыкладаў, каб зразумець ягоную сістэму і паспрабаваць знайсці рашэнне.

1 Like

Каді слова не знаходзіцца ў базе (у тым ліку абрубак), то тады адбываецца звычайны пошук па супадзенні тэксту

“руск” не знаходзіцца ў базе - знайшло “руск” і вылучыла яго, тут ок
але чаму пры гэтым вылучае і “старабеларуск”?

1 Like

Калі набраць “франц”, атрымаем адны калькі з французскай. :slight_smile:

1 Like

Казалі, што фразеалагізмаў 1750, а піша “20 з 2072”. Усюды падман.

1 Like

Там яшчэ недзе 300 артыкулаў накшталт “Гл. гэтую фразу”)

1 Like

Вельмі крутая рэч! Было б нядрэнна мець regex пошук. Пакуль яно дзіўна рэагуе на рэгулярныя выразы


Рэгулярныя выразу пакуль не падтрымліваюцца, пошук альбо па формах, калі слова вядомае, інакш шукае ўваход гэтага невядомага слова.