Хмарка тегів: відмінності між версіями

[неперевірена версія][неперевірена версія]
Вилучено вміст Додано вміст
Немає опису редагування
Рядок 48:
Розвиваючи принципи облікової тексту, '''хмари словосполучень''' дають більш сфокусований вид тексту або [[:en:text corpus|набору текстів]]. Замість всього тексту, хмара словосполучень фокусується на використанні окремих слів. Отримане хмара містить слова, які часто використовуються в поєднанні з вихідним словом. Ці [[Фразеологизм#.D0.A4.D1.80.D0.B0.D0.B7.D0.B5.D0.BE.D0.BB.D0.BE.D0.B3.D0.B8.D1.87.D0.B5.D1.81.D0.BA.D0.B8.D0.B5_.D1.81.D0.BE.D1.87.D0.B5.D1.82.D0.B0.D0.BD.D0.B8.D1.8F|словосполучення]] являють частоту, що виділяється розміром шрифту, поряд з силою зв'язку, що виділяється яскравістю. Це дозволяє інтерактивно вивчати мову.
 
=== Особливості сприйняття хмар тегів ===
Хмари тегів вивчалися в кількох дослідженнях на предмет зручності використання. Такий перелік заснований на результатах досліджень компанії Lohmann та ін.:
 
Рядок 63:
Дослідження: хмари тегів допомагають знайти специфічні теги (які не виділені великим розміром шрифту).
 
=== Створення хмари тегів ===
Загалом розмір шрифту тега в хмарі тегів обумовлений поширеністю тега. Для хмари слів, наприклад, категорій блогу, частота відповідає кількості записів у блозі, яким присвоєна ця категорія. Для менших частот можна вказати розміри шрифту безпосередньо, від едінінци до максимально використовуваного розміру шрифту. Для великих частот необхідно провести масштабування. Наприклад, використовуючи лінійне перетворення, вага t_i тега масштабується за шкалою множників від of 1 до f, де t_{min} і t_{max} визначають діапазон дозволених ваг.