Licznik Słów: Licz Słowa, Znaki i Linie Online
Wklej dowolny tekst i zobacz na żywo liczbę słów, znaków, linii, akapitów, zdań oraz reading time. Bez wysyłki, bez rejestracji, nic nie opuszcza twojej przeglądarki.
Czym jest ten licznik słów
Darmowy licznik słów działający w przeglądarce. Wrzuć esej, szkic tweeta, meta description albo wpis na bloga liczący 4 000 słów, a dostaniesz na żywo liczbę słów, znaków ze spacjami i bez, linii, akapitów, zdań oraz szacowany reading time. Tekst nigdy nie opuszcza twojego komputera.
Istnieje dla tych drobnych, codziennych chwil: jesteś 12 znaków ponad limit 280 na X, twoja meta description ma 187 znaków i Google ją utnie, w aplikacji na uczelnię stoi "500 words maksymalnie", a okno word count w MS Word jest schowane dwa menu w głąb. Wklej, spójrz, popraw, idź dalej.
Liczenie jest też ciekawsze, niż wygląda. Artykuł na Wikipedii o liczeniu słów zauważa, że MS Word, Pages i Google Docs zwracają dla tego samego dokumentu nieco różne liczby, głównie ze względu na to, jak każdy z nich traktuje wyrazy z myślnikiem, em dashes i przypisy w linii. Mówimy wprost, jakiej reguły używamy, żebyś mógł odnieść wynik do edytora, któremu ufasz.
Jak naprawdę działają liczenia
Słowa liczymy, dzieląc na białych znakach i odfiltrowując puste wpisy. To to samo podejście, którego pod maską używają MS Word, Google Docs i większość platform blogowych. Jest szybkie i wystarczające dla angielskiego, francuskiego, hiszpańskiego i innych języków rozdzielanych spacjami. Kompromis: nie da się tak poprawnie policzyć słów w chińskim, japońskim, koreańskim ani tajskim, bo te systemy pisma nie rozdzielają słów spacjami. Do granic słów zgodnych ze specyfikacją w dowolnym języku właściwym narzędziem jest Intl.Segmenter, implementujący algorytm z Unicode UAX #29 (Text Segmentation). Pokazujemy uwagę o CJK, jeśli wejście tego wymaga.
Znaki liczymy na dwa sposoby: ze spacjami (każdy code point w łańcuchu) i bez spacji (z pominięciem ASCII spacji, tabulatorów i nowych linii). To, której liczby potrzebujesz, zależy od limitu, który sprawdzasz. Tytuły stron, meta description i wiadomości SMS liczą spacje. Twitter to osobna sprawa, zobacz FAQ. Raportujemy też liczbę widocznych znaków przy użyciu klastrów grafemów, dzięki czemu rodzinna emoji złożona z 7 code points wciąż liczy się dla człowieka jako jeden znak.
Linie, akapity i zdania uzupełniają panel. Linie dzielą się na znaku nowej linii. Akapity dzielą się na pustych liniach (jednej lub kilku kolejnych pustych liniach). Zdania dzielą się na ., ! i ? po których następuje biały znak, co daje właściwy wynik dla większości prozy, ale błędnie liczy "Mr. Smith said hello" jako dwa zdania, a "i.e." jako początek nowego. Nie istnieje wiarygodny segmentator zdań, który zmieści się w 200 liniach JavaScriptu; jeśli twój tekst jest pełen skrótów, traktuj liczbę zdań jako szacunek.
Jak policzyć słowa w trzech krokach
Jeden panel tekstu, sześć liczeń na żywo. Nic do instalacji, nic do wysyłania, bez konta.
- 1
Wklej lub wpisz swój tekst
Wklej z MS Word, Google Docs, klienta poczty, szkicu SMS lub edytora CMS. Albo kliknij Upload, żeby wczytać plik .txt lub .md. Przycisk Sample wstawia akapit, jeśli najpierw chcesz zobaczyć, jak ruszają liczniki. Wklejanie usuwa formatowanie, czyli to, czego oczekujesz; liczony jest tylko tekst.
- 2
Patrz, jak liczenia aktualizują się na żywo
Każde liczenie aktualizuje się, gdy piszesz lub edytujesz. Słowa, znaki ze spacjami, znaki bez spacji, linie, akapity, zdania i reading time są widoczne jednocześnie. Szacunek reading time używa 230 words per minute dla ogólnej prozy. Jest też detektor CJK, który ostrzega, kiedy liczenie słów po spacjach zaniży twoje wejście.
- 3
Skopiuj tekst lub liczenia
Naciśnij Copy, by zabrać oczyszczony tekst z powrotem do schowka, lub użyj chipów liczeń, by skopiować konkretną liczbę. Download zapisuje tekst jako .txt. Jeśli potrzebujesz innej reguły liczenia (na przykład traktowania wyrazów z myślnikiem jako jednego słowa), zmień wejście, a liczenia się zaktualizują; po stronie serwera nie ma czego konfigurować.
Kiedy licznik słów jest właściwym narzędziem
Trafianie w 280 znaków X (Twitter)
Piszesz wątek, drugi tweet ma 312 znaków i musisz go skrócić, nie tracąc puenty. Wklej tweeta tutaj, obserwuj liczbę znaków, tnij, aż wpadniesz w 280 lub mniej. Pamiętaj, że X liczy URL-e jako 23 znaki niezależnie od długości, a emoji jako 2, więc naiwna liczba znaków lekko zaniża, ile masz miejsca. Zobacz FAQ o ważeniu Twittera.
Limity słów w esejach akademickich i aplikacjach na uczelnie
List motywacyjny na 500 słów, esej z literatury na 4 000 słów, abstrakt na 250 słów na konferencję. Większość instytucji liczy każdy token rozdzielony spacją jako jedno słowo, w tym wyrazy z myślnikiem jako jedno słowo. To zgadza się z tym, co raportujemy. Limit eseju Common App to 650 słów i są surowi; licznik różniący się od ich o 10 to różnica między wysłanym a odrzuconym.
SEO meta description i tytuły stron
Google ucina tytuły stron około 60 znaków, na mobile czasem wcześniej. Meta description ucinane są około 160. Oba to liczby znaków łącznie ze spacjami. Wklej szkic tutaj, obserwuj licznik, pisz na nowo, aż ważne słowa kluczowe wpadną przed punktem ucięcia. Ta sama reguła dotyczy tytułów Open Graph i opisów Twitter card.
Budżety znaków dla SMS i powiadomień push
Standardowy SMS to 160 znaków w kodowaniu GSM 7-bit, spada do 70 znaków na segment, gdy tylko dodasz znak spoza GSM (np. emoji albo cudzysłów drukarski). Powiadomienia push w iOS są ucinane około 178 znaków na podglądzie ekranu blokady. Twój tekst może zmieścić się w jednym SMS-ie przy 159 znakach i rozejść się na dwa przy 161; licznik mówi dokładnie, gdzie jest granica.
Szacowany reading time dla wpisu na bloga
Platformy blogowe jak Medium i Substack pokazują na górze artykułu szacunek reading time. Standardowa matematyka to liczba słów dzielona przez 230 (typowa dorosła szybkość czytania dla ogólnej prozy), zaokrąglona w górę. Treści techniczne z blokami kodu lub wzorami idą wolniej, około 100 words per minute, więc szacunek obiecuje za dużo dla wpisów inżynierskich. How-to na 1 200 słów to mniej więcej 5 minut czytania.
Porównywanie liczby słów przed i po redakcji
Napisałeś szkic na 1 400 słów, a brief mówi poniżej 1 000. Wklej oryginał, wklej skróconą wersję w drugiej zakładce i widzisz dokładnie, ile wyciąłeś. Do diff side-by-side, który pokazuje, które zdania się przeniosły lub zostały przepisane, a nie tylko deltę liczby, nasze narzędzie compare-text obsługuje ten przypadek. Zestaw oba, kiedy potrzebujesz obu metryk.
Przypadki brzegowe liczenia słów i znaków
Sytuacje liczenia, na których wykładają się większość narzędzi, z tym, co my robimy i na co uważać. Jeśli liczenie wygląda dziwnie, odpowiedź zwykle jest tutaj.
| Topic | What this tool does |
|---|
| Podział po białych znakach vs segmentacja Unicode | Dzielimy po białych znakach, co jest szybkie i pasuje do MS Word/Google Docs dla angielskiego. Alternatywą zgodną ze specyfikacją jest Unicode UAX #29, dostępna w JavaScript przez Intl.Segmenter. Stosuj ją, gdy pokrycie języków liczy się bardziej niż prędkość. |
|---|
| Języki CJK bez spacji między słowami | Chiński, japoński, koreański i tajski nie rozdzielają słów spacjami. Liczenie po spacjach zwraca dla całego akapitu mniej więcej 1. Dla tych języków sensowną metryką jest liczba znaków, która tutaj działa poprawnie. Do prawdziwego liczenia słów CJK użyj Intl.Segmenter. |
|---|
| Emoji i Unicode code pointy | Rodzinna emoji 👨👩👧👦 wygląda jak jeden znak, ale to 7 code pointów UTF-16 połączonych łącznikami zerowej szerokości. Liczymy grafemy (widoczne znaki) dla przyjaznej liczby i osobno code pointy. Modyfikator odcienia skóry na kciuku w górę to jeden grafem, ale dwa code pointy. |
|---|
| Ważenie znaków w Twitter / X | X waży każdy znak: większość ASCII liczy się jako 1, emoji i CJK jako 2, a URL-e są stałe na 23 niezależnie od długości. Nasza liczba znaków to liczba surowa. Odejmij około 7 z budżetu 280 za każdą użytą emoji. |
|---|
| URL-e i @mentions w tweetach | X redukuje każdy URL przez t.co do 23 znaków niezależnie od długości linku. @mentions liczone są w ich dosłownej długości. Nasz licznik pokazuje surową długość, więc tweet z dwoma długimi URL-ami będzie tu czytał się dłużej, niż raportuje X. |
|---|
| Cudzysłowy drukarskie vs proste | "Krzywe" i "proste" cudzysłowy to różne znaki Unicode, ale każdy liczy się jako jeden znak. W większości fontów wyglądają podobnie; wklejanie z MS Word lub Pages zwykle po cichu zamienia je na drukarskie. Jeśli wklejasz kod, najpierw zamień je z powrotem. |
|---|
| Końcowe białe znaki i puste linie | Spacje na końcu linii nadal liczą się jako znaki. Zamykający znak nowej linii na końcu dokumentu liczy się jako linia. Puste linie między akapitami wliczają się do sumy linii, ale rozdzielają akapity w liczeniu akapitów. |
|---|
| Kodowanie (UTF-8) i długość w bajtach | Większość API, które podają "limit znaków", ma na myśli znaki Unicode, ale niektóre mają na myśli bajty UTF-8. Emoji to 4 bajty w UTF-8, znak CJK to 3, a litera Latin z akcentem to 2. Jeśli twój limit jest w bajtach, nasza liczba znaków będzie zaniżona. Twitter to słynne miejsce pośrednie: ani bajty, ani znaki, tylko własny ważony schemat. |
|---|
Licznik słów: często zadawane pytania
Jaka jest różnica między liczbą słów a liczbą znaków?
Liczba słów to liczba tokenów rozdzielonych białymi znakami w twoim tekście, więc "hello world" to dwa słowa. Liczba znaków to liczba pojedynczych znaków, więc "hello world" to 11 znaków ze spacją, 10 bez. Różne platformy interesują się różnymi liczbami: eseje akademickie używają liczby słów, limity SMS i tweetów używają liczby znaków, a tagi title SEO też używają liczby znaków. Licznik pokazuje obie naraz, żebyś wybrał tę odpowiednią dla swojego kontekstu.
Jak dokładnie to narzędzie liczy słowa?
Dzieli wejście na białych znakach (spacjach, tabulatorach, nowych liniach) i liczy niepuste fragmenty. Tak więc "fast-paced" to jedno słowo, "well known" to dwa, a "isn't" to jedno. Pasuje to do MS Word i Google Docs przy angielskiej prozie. Kompromis polega na tym, że nie radzi sobie poprawnie z chińskim, japońskim ani koreańskim, ponieważ te języki nie rozdzielają słów spacjami. Do liczenia słów zgodnego ze specyfikacją w dowolnym języku nowoczesne przeglądarki dostarczają Intl.Segmenter, który implementuje algorytm granic słów Unicode.
Jak liczony jest reading time?
Reading time to liczba słów podzielona przez 230 words per minute, zaokrąglona w górę do najbliższej minuty. 230 wpm to rozsądny środek dla dorosłych czytelników na ogólnej prozie; publikowane szacunki sięgają od 200 do 250 wpm dla materiałów nietechnicznych. Pisanie techniczne z blokami kodu, wzorami albo nieznaną terminologią spowalnia czytelników do około 50 do 100 wpm, więc szacunek obiecuje za dużo dla treści inżynierskich albo naukowych. Jeśli chcesz ściślejszej matematyki dla niszowej publiczności, podziel swoją liczbę słów przez ich rzeczywistą szybkość czytania.
Czy liczy poprawnie tekst chiński, japoński albo koreański?
Dla słów nie. Języki CJK nie rozdzielają słów spacjami, więc liczenie słów oparte na białych znakach zwraca w przybliżeniu 1 dla całego akapitu CJK. Liczby znaków pozostają dokładne (jeden znak CJK to jeden znak) i to zwykle jest metryka, którą się dla tych języków interesuje: limit eseju po japońsku jest w znakach, nie w słowach. Jeśli potrzebujesz prawdziwego liczenia słów CJK, API Intl.Segmenter w nowoczesnych przeglądarkach implementuje algorytm segmentacji słów Unicode i poprawnie obsługuje CJK, tajski i inne pisma bez spacji.
Czy coś jest zapisywane albo wysyłane?
Nie. Licznik działa w całości w twojej przeglądarce. Nic nie jest wysyłane na serwer, logowane ani przechowywane. Możesz wkleić poufny szkic, niepublikowany artykuł albo zeznanie podatkowe i zamknąć kartę; nie zostaje żadnej kopii. Aby się upewnić, otwórz DevTools, przejdź do zakładki Network i obserwuj podczas pisania. Przy aktualizacji liczeń nie ma żadnych żądań wychodzących. Narzędzie jest też otwarte na temat zależności; jedynym kodem liczącym jest zwykły JavaScript działający na twojej maszynie.
Czy X (Twitter) naprawdę liczy emoji jako 2 znaki?
Z grubsza tak. X używa niestandardowego ważenia, w którym większość basic Latin, cyfr i powszechnych znaków interpunkcyjnych liczy się jako 1, a praktycznie wszystko inne (emoji, CJK, znaki z akcentami) liczy się jako 2 z limitu 280 znaków. Dokładny algorytm jest w ich dokumentacji counting-characters; korzysta z zakresów code point, a nie z klastrów grafemów, więc emoji flagi (które są dwoma code pointami regional indicator) faktycznie liczy się jako 4. URL-e są specjalnym przypadkiem 23 znaków niezależnie od długości. Nasza liczba znaków jest surowa, nie ważona.
Prywatność i jak to działa
Twój tekst nigdy nie opuszcza przeglądarki. Liczenie, dzielenie i renderowanie odbywają się na twojej maszynie. Nie wysyłamy tekstu, nie logujemy go ani nie przepuszczamy przez żadną zewnętrzną usługę. Możesz wkleić poufny szkic, niepublikowany esej albo dowolną inną prywatną treść i zamknąć kartę bez śladu. Aby się upewnić, otwórz DevTools przeglądarki, przejdź do zakładki Network i obserwuj podczas pisania; nie ma żadnych żądań wychodzących. Jedyną zależnością jest własny silnik JavaScript przeglądarki plus opcjonalny Intl.Segmenter do liczenia grafemów. Jeśli potrzebujesz diff tekstu side-by-side, case converter, sposobu na sortowanie linii albo usuwanie zduplikowanych linii, te narzędzia są o jedno kliknięcie i stosują tę samą politykę in-browser.