Хмарка тегів: відмінності між версіями

[неперевірена версія][неперевірена версія]
Вилучено вміст Додано вміст
Немає опису редагування
м Виконується завдання для роботів: Литература → Джерела; косметичні зміни
Рядок 1:
[[Файл:Web 2.0 Map.svg|thumb|right|320x320px|Хмарка тегів з термінами, пов'язаними з [[Веб 2.0]]]]
'''Хмара тегів (хмара слів, або зважений список,''' '''представлене (-ий) візуально''') — це візуальне подання списку категорій (або тегів, також званих мітками, ярликами, ключовими словами, тощо.) Зазвичай використовується для опису [[Ключове слово|ключових слів (тегів)]] на веб-сайтах, або для представлення неформатованого тексту. Ключові слова найчастіше являють собою окремі слова, і важливість кожного ключового слова позначається розміром шрифту або кольором . Таке уявлення зручно для швидкого сприйняття найвідоміших термінів і для розподілу термінів за популярністю щодо один одного . При використанні ключових слів для спрощення навігації по веб-сайтам, терміни забезпечуються гіперпосиланнями на поняття, які маються на увазі під ключовими словами. Тим не менш, хмара не може бути єдиним елементом навігації, а користуватися текстовим пошуком зручніше для пошуку при наявності більш конкретної інформації про шуканий.
 
== Історія ==
Рядок 15:
 
== Типи застосування тегів ==
[[Файл:Word population tagcloud 2011.png|мини|450px|Хмара даних показує населення всіх країн світу. Створено з допомогою мови програмування [[R_R (Мова_програмуванняМова програмування)|R]] за допомогою пакету хмара слів. Дані отримані з [[Список_країн_по_населеннюСписок країн по населенню|списку, що містить назву країн та кількість жителів]]. Зверніть увагу, що відносні розміри Китаю та Індії були розділені навпіл.]]
Існує три основних типи застосування облікової тегів у соціальному програмному забезпеченні, що розрізняються швидше за призначенням, ніж за зовнішнім виглядом:
* в першому типі є тег для частоти кожного елемента, 
Рядок 23:
У першому типі хмар тегів розмір являє собою кількість застосувань тега до елементу. Це корисно в якості способу відображення [[Метадані|метаданих]] про предмет, за який скільки-то раз «проголосували», і коли точні дані не передбачені. Прикладом такого застосування є [[Last.fm]] (для визначення жанру музики гурту) та [[:en:LibraryThing|LibraryThing]] (для визначення ключових слів книги). 
 
У другому типі розмір відповідає числу предметів, до яких був застосований тег, що позначає популярність тега. Приклади цього типу хмар тегів можна знайти на сайті сервісу зберігання та розповсюдження цифрових фотографій [[Flickr]], [[RSS-агрегатор|RSS-агрегатора]]а [[Technorati]] та ввівши в пошуковий запит [[Google]] [[:en:DeeperWeb|DeeperWeb]]. 
 
=== Категоризація шляхом створення кластера тегів ===
Рядок 39:
 
=== '''Хмара даних ''' ===
'''Хмара даних''' — це дані, в яких використовується інший колір і/або розмір шрифту для позначення числових даних. Хмари даних схожі на хмари тегів, але замість підрахунку слів, виводяться такі дані, як густота населення або ціни на [[Рынок_ценных_бумагРынок ценных бумаг|ринку цінних паперів]]. 
 
=== Хмара тексту ===
Рядок 46:
 
=== Хмари словосполучень ===
Розвиваючи принципи облікової тексту, '''хмари словосполучень''' дають більш сфокусований вид тексту або [[:en:text corpus|набору текстів]]. Замість всього тексту, хмара словосполучень фокусується на використанні окремих слів. Отримане хмара містить слова, які часто використовуються в поєднанні з вихідним словом. Ці [[Фразеологизм#.D0.A4.D1.80.D0.B0.D0.B7.D0.B5.D0.BE.D0.BB.D0.BE.D0.B3.D0.B8.D1.87.D0.B5.D1.81.D0.BA.D0.B8.D0.B5_B5 .D1.81.D0.BE.D1.87.D0.B5.D1.82.D0.B0.D0.BD.D0.B8.D1.8F|словосполучення]] являють частоту, що виділяється розміром шрифту, поряд з силою зв'язку, що виділяється яскравістю. Це дозволяє інтерактивно вивчати мову.
 
== Особливості сприйняття хмар тегів ==
Рядок 64:
 
== Створення хмари тегів ==
Загалом розмір шрифту тега в хмарі тегів обумовлений поширеністю тега. Для хмари слів, наприклад, категорій блогу, частота відповідає кількості записів у блозі, яким присвоєна ця категорія. Для менших частот можна вказати розміри шрифту безпосередньо, від едінінци до максимально використовуваного розміру шрифту. Для великих частот необхідно провести [[Масштабирование|масштабування]]. Наприклад, використовуючи лінійне перетворення, вага <math>t_i</math> тега масштабується за шкалою множників від of 1 до f, де <math>t_{min}</math> і <math>t_{max}</math> визначають діапазон дозволених ваг.
[[Файл:Wikipedia Wordle - Top 1000 vital article hits.png|мини|450px|Набір слів зі списку 1000 вибраних статей Вікіпедії, впорядкований за кількістю переглядів, доступний в галереї Wordle gallery.{{sfn|WikipediaTop1000VitalArticleHits}}]]
<math>s_i = \left \lceil \frac{f_{\mathrm{max}}\cdot(t_i - t_{\mathrm{min}})}{t_{\mathrm{max}}-t_{\mathrm{min}}} \right \rceil</math> для <math>t_i > t_{\mathrm{min}}</math>; иначе <math>s_{i}=1</math>
Рядок 77:
 
 
Реалізація хмари тегів також включає [[Синтаксический_анализСинтаксический анализ|синтаксичний аналіз]] фільтрацію непотрібних тегів, таких як прийменники, займенники, числа та розділові знаки. 
 
 
Рядок 93:
{{примечания|2}}
 
== ЛитератураДжерела ==
* {{статья |ref = Kaser, Lemire
|автор = Owen Kaser and Daniel Lemire