Ordtæller: Tæl ord, tegn og linjer online
Indsæt en hvilken som helst tekst og se live-tællinger for ord, tegn, linjer, afsnit, sætninger og reading time. Ingen upload, ingen tilmelding, intet forlader din browser.
Hvad denne ordtæller er
En gratis ordtæller, der kører i browseren. Smid en stil ind, et tweet-udkast, en meta description eller et blogindlæg på 4.000 ord, og du får live-tællinger for ord, tegn med og uden mellemrum, linjer, afsnit, sætninger og en estimeret reading time. Teksten forlader aldrig din maskine.
Den findes til de små, dagligdags øjeblikke: du er 12 tegn over 280-grænsen på X, din meta description er på 187 tegn, og Google kommer til at klippe den, din studieansøgning siger "500 words maksimum", og MS Words word count-dialog ligger to menuer nede. Indsæt, kig, ret, videre.
Tælling er også mere interessant, end den ser ud. Wikipedia-artiklen om ordoptælling bemærker, at MS Word, Pages og Google Docs returnerer lidt forskellige tal for det samme dokument, mest på grund af hvordan hver håndterer bindestregsord, em dashes og indlejrede fodnoter. Vi er åbne om, hvilken regel vi bruger, så du kan koble svaret til den editor, du stoler på.
Hvordan tællingerne reelt fungerer
Ord tælles ved at splitte på whitespace og frasortere tomme indgange, samme tilgang som MS Word, Google Docs og de fleste blogplatforme bruger under motorhjelmen. Det er hurtigt og godt nok til engelsk, fransk, spansk og andre mellemrumsadskilte sprog. Afvejningen: det kan ikke tælle ord korrekt på kinesisk, japansk, koreansk eller thai, fordi de skriftsystemer ikke sætter mellemrum mellem ord. Til spec-korrekte ordgrænser i ethvert sprog er det rigtige værktøj Intl.Segmenter, der implementerer algoritmen i Unicode UAX #29 (Text Segmentation). Vi viser en CJK-note, når input ser ud til at have brug for det.
Tegn tælles på to måder: med mellemrum (hvert code point i strengen) og uden mellemrum (eksklusive ASCII-mellemrum, tabs og linjeskift). Hvilket tal du har brug for, afhænger af den grænse, du tjekker mod. Sidetitler, meta descriptions og SMS-beskeder tæller mellemrum med. Twitter er sin egen sag, se FAQ. Vi rapporterer også antallet af synlige tegn via grafem-klynger, så en familie-emoji, der fylder 7 code points, stadig tæller som ét tegn for en menneskelig læser.
Linjer, afsnit og sætninger gør panelet færdigt. Linjer splittes på linjeskift. Afsnit splittes på tomme linjer (en eller flere på hinanden følgende tomme linjer). Sætninger splittes på ., ! og ? efterfulgt af whitespace, hvilket giver det rigtige svar for det meste prosa, men tæller forkert "Mr. Smith said hello" som to sætninger og "i.e." som starten på en ny. Der findes ingen pålidelig sætningssegmenterer, der kan løbes på 200 linjer JavaScript; hvis din tekst er fuld af forkortelser, så behandl sætningstallet som et groft skøn.
Sådan tæller du ord i tre trin
Ét tekstfelt, seks live-tællinger. Intet at installere, intet at uploade, ingen konto påkrævet.
- 1
Indsæt eller skriv din tekst
Indsæt fra MS Word, Google Docs, din mailklient, et SMS-udkast eller en CMS-editor. Eller klik Upload for at indlæse en .txt- eller .md-fil. Sample-knappen indsætter et afsnit, hvis du først vil se tællerne bevæge sig. Indsætning fjerner formatering, hvilket er det, du vil have; kun teksten tælles.
- 2
Se tællingerne opdatere live
Hver tælling opdaterer, mens du skriver eller redigerer. Ord, tegn med mellemrum, tegn uden mellemrum, linjer, afsnit, sætninger og reading time er alle synlige på samme tid. Reading time-skønnet bruger 230 words per minute for almindelig prosa. Der er også en CJK-detektor, der advarer, når mellemrumsbaseret ordtælling underestimerer dit input.
- 3
Kopier teksten eller tællingerne
Tryk Copy for at få den oprydede tekst tilbage i udklipsholderen, eller brug tællechipsne til at kopiere et bestemt tal. Download gemmer teksten som .txt. Hvis du har brug for en anden tælleregel (for eksempel at behandle bindestregsord som ét ord), justér input, og tællingerne opdaterer; der er intet at konfigurere på serversiden.
Hvornår en ordtæller er det rigtige værktøj
At ramme 280-tegnsgrænsen på X (Twitter)
Du skriver en tråd, andet tweet er på 312 tegn, og du skal trimme uden at miste pointen. Indsæt tweetet her, hold øje med tegntællingen, klip indtil du lander på 280 eller derunder. Bemærk at X tæller URLs som 23 tegn uanset længde og emoji som 2, så en naiv tegntælling underestimerer en smule, hvor meget plads der er tilbage. Se FAQ om Twitter-vægtning.
Ordgrænser for akademiske opgaver eller studieansøgninger
En personlig ansøgning på 500 ord, en litteraturopgave på 4.000 ord, et abstract på 250 ord til en konferencesindsendelse. De fleste institutioner tæller ethvert mellemrumsadskilt token som ét ord, inklusive bindestregsord som ét ord. Det matcher det, vi rapporterer. Common App-essay-grænsen er 650 ord, og de er strenge; en tæller, der afviger fra deres med 10, er forskellen mellem indsendt og afvist.
SEO meta descriptions og sidetitler
Google klipper sidetitler omkring 60 tegn, nogle gange tidligere på mobil. Meta descriptions klippes omkring 160. Begge er tegntællinger inklusive mellemrum. Indsæt dit udkast her, hold øje med tælleren, omskriv indtil de vigtige nøgleord lander før klippepunktet. Den samme regel gælder for Open Graph-titler og Twitter card-beskrivelser.
Tegnbudgetter for SMS og push-notifikationer
En standard SMS er 160 tegn i 7-bit GSM-encoding, og falder til 70 tegn pr. segment, hvis du inkluderer ét tegn uden for GSM (for eksempel en emoji eller et typografisk citationstegn). Push-notifikationer på iOS klippes omkring 178 tegn i låseskærmens forhåndsvisning. Din tekst kan være i ét SMS ved 159 tegn og blive delt i to ved 161; tælleren fortæller dig præcis, hvor grænsen er.
Reading time-skøn for et blogindlæg
Blogplatforme som Medium og Substack viser et reading time-skøn øverst i artiklen. Standardregningen er totalt antal ord delt med 230 (en typisk voksen læsehastighed for almindelig prosa), rundet op. Teknisk indhold med kodeblokke eller matematik går langsommere, omkring 100 words per minute, så skønnet lover for meget for engineering-indlæg. En how-to på 1.200 ord er groft 5 minutters læsning.
Sammenlign ordtællinger før og efter redigering
Du skrev et udkast på 1.400 ord, og briefen siger under 1.000. Indsæt originalen, indsæt den trimmede version i en anden fane, og du kan se præcis, hvor meget du har klippet. For en side-om-side-diff, der viser, hvilke sætninger der er flyttet eller skrevet om snarere end blot tællingsforskellen, dækker vores compare-text-værktøj det tilfælde. Sæt dem sammen, når du har brug for begge metrikker.
Grænsetilfælde ved ord- og tegntælling
Tællesituationerne, der snubler over de fleste værktøjer, med hvad vi gør, og hvad du skal holde øje med. Ser en tælling skæv ud, er svaret normalt her.
| Topic | What this tool does |
|---|
| Whitespace-split vs Unicode-segmentering | Vi splitter på whitespace, hvilket er hurtigt og matcher MS Word/Google Docs for engelsk. Det spec-korrekte alternativ er Unicode UAX #29, eksponeret i JavaScript via Intl.Segmenter. Brug det, når sprogdækning betyder mere end hastighed. |
|---|
| CJK-sprog uden ordmellemrum | Kinesisk, japansk, koreansk og thai adskiller ikke ord med mellemrum. En whitespace-tælling returnerer omkring 1 for et helt afsnit. For disse sprog er den meningsfulde metrik tegntælling, som virker korrekt her. Brug Intl.Segmenter for rigtige CJK-ordtællinger. |
|---|
| Emoji og Unicode-code-points | En familie-emoji 👨👩👧👦 ligner ét tegn, men er 7 UTF-16-code-points bundet sammen af zero-width joiners. Vi tæller grafemer (synlige tegn) til det menneskevenlige tal, og code points separat. En hudtonemodifikator på en thumbs-up er ét grafem, men to code points. |
|---|
| Twitter / X tegnvægtning | X vægter hvert tegn: det meste ASCII tæller som 1, emoji og CJK som 2, og URLs er låst på 23 uanset længde. Vores tegntælling er rå-tællingen. Træk omtrent 7 fra 280-budgettet for hver emoji, du bruger. |
|---|
| URLs og @mentions i tweets | X reducerer hver URL til 23 tegn via t.co uanset hvor lang det faktiske link er. @mentions tælles ved deres bogstavelige længde. Vores tæller viser rå-længde, så et tweet med to lange URLs vil læses som længere her end det, X rapporterer. |
|---|
| Smart-citater vs lige citater | Krøllede og lige "citationstegn" er forskellige Unicode-tegn, men hver tæller som ét tegn. De ligner hinanden i de fleste skrifttyper; indsætning fra MS Word eller Pages udskifter normalt stille til smart-citater. Indsætter du kode, så konvertér tilbage først. |
|---|
| Afsluttende whitespace og tomme linjer | Mellemrum i slutningen af en linje tæller stadig som tegn. Et afsluttende linjeskift i slutningen af dokumentet tæller som én linje. Tomme linjer mellem afsnit tæller med i linjetotalen, men adskiller afsnit i afsnitstællingen. |
|---|
| Encoding (UTF-8) og bytelængde | De fleste API'er, der nævner en "tegngrænse", mener Unicode-tegn, men nogle få mener UTF-8-bytes. En emoji er 4 bytes i UTF-8, et CJK-tegn er 3, et accentbærende latinsk bogstav er 2. Hvis din grænse er i bytes, vil vores tegntælling underestimere. Twitter er den berømte mellemvej: hverken bytes eller tegn, men sit eget vægtede skema. |
|---|
Ordtæller: ofte stillede spørgsmål
Hvad er forskellen mellem ordtælling og tegntælling?
Ordtælling er antallet af mellemrumsadskilte tokens i din tekst, så "hello world" er to ord. Tegntælling er antallet af enkelte tegn, så "hello world" er 11 tegn med mellemrummet, 10 uden. Forskellige platforme bekymrer sig om forskellige tal: akademiske opgaver bruger ordtælling, SMS- og tweet-grænser bruger tegntælling, og SEO-title-tags bruger også tegntælling. Tælleren viser begge på samme tid, så du kan vælge den rigtige til din kontekst.
Hvordan tæller dette værktøj ord præcist?
Det splitter input på whitespace (mellemrum, tabs, linjeskift) og tæller de ikke-tomme stykker. Så "fast-paced" er ét ord, "well known" er to og "isn't" er ét. Det matcher MS Word og Google Docs på engelsk prosa. Afvejningen er, at det ikke håndterer kinesisk, japansk eller koreansk korrekt, fordi de sprog ikke adskiller ord med mellemrum. Til spec-korrekt ordtælling på alle sprog leveres Intl.Segmenter med moderne browsere og implementerer Unicodes algoritme for ordgrænser.
Hvordan beregnes reading time?
Reading time er ord delt med 230 words per minute, rundet op til nærmeste minut. 230 wpm er et rimeligt midtpunkt for voksne læsere på almindelig prosa; offentliggjorte skøn går fra 200 til 250 wpm for ikke-teknisk materiale. Teknisk skrivning med kodeblokke, formler eller ukendt terminologi sænker læsere til omkring 50 til 100 wpm, så skønnet lover for meget for engineering- eller videnskabeligt indhold. Vil du have strengere matematik for et nichepublikum, så del din ordtælling med deres faktiske læsehastighed.
Tæller den kinesisk, japansk eller koreansk tekst korrekt?
For ord, nej. CJK-sprog sætter ikke mellemrum mellem ord, så en mellemrumsbaseret ordtælling returnerer tæt på 1 for et helt CJK-afsnit. Tegntællinger er stadig præcise (et CJK-tegn er ét tegn), og det er normalt den metrik, der tæller for de sprog: en grænse for et japansk essay er i tegn, ikke ord. Hvis du har brug for en rigtig CJK-ordtælling, implementerer Intl.Segmenter-API'et i moderne browsere Unicodes ordsegmenteringsalgoritme og håndterer korrekt CJK, thai og andre skriftsystemer uden mellemrum.
Bliver der gemt eller uploadet noget?
Nej. Tælleren kører helt i din browser. Intet sendes til en server, logges eller gemmes. Du kan indsætte et fortroligt udkast, en uudgivet artikel eller din selvangivelse og lukke fanen; der er ingen kopi tilbage. For at verificere, åbn DevTools, skift til Network-fanen og hold øje, mens du skriver. Der er ingen udgående requests, når tællingerne opdaterer. Værktøjet er åbent om sine afhængigheder; den eneste involverede tællekode er almindelig JavaScript, der kører på din maskine.
Tæller X (Twitter) virkelig emoji som 2 tegn?
Stort set ja. X bruger en brugerdefineret vægtning, hvor det meste basic Latin, cifre og almindelig tegnsætning tælles som 1, og stort set alt andet (emoji, CJK, accenttegn) tælles som 2 af de 280 tegns budget. Den nøjagtige algoritme findes i deres counting-characters-dokumentation; den bruger code-point-intervaller i stedet for grafem-klynger, så en flag-emoji (der er to regional indicator-code-points) faktisk tælles som 4. URLs er specialhåndteret til 23 tegn uanset længde. Vores tegntælling er rå-tællingen, ikke den vægtede.
Privatliv og hvordan det virker
Din tekst forlader aldrig din browser. Tælling, opsplitning og rendering kører alle på din maskine. Vi uploader ikke teksten, logger den ikke og sender den ikke gennem nogen tredjepartstjeneste. Du kan indsætte et fortroligt udkast, et uudgivet essay eller andet privat indhold og lukke fanen uden at efterlade spor. For at verificere, åbn din browsers DevTools, skift til Network-fanen og hold øje, mens du skriver; der er ingen udgående requests. Den eneste afhængighed er browserens egen JavaScript-motor plus valgfri Intl.Segmenter til grafemtælling. Hvis du har brug for en side-om-side-tekst-diff, en case converter, en måde at sortere linjer på eller en fjerner af duplikatlinjer, er de værktøjer ét klik væk og følger den samme in-browser-politik.