Kelime Sayacı: Kelime, Karakter ve Satırları Online Sayın
Herhangi bir metni yapıştırın ve kelime, karakter, satır, paragraf, cümle ve reading time için canlı sayımları görün. Yükleme yok, kayıt yok, hiçbir şey tarayıcınızdan çıkmaz.
Bu kelime sayacı nedir
Tarayıcı içinde çalışan ücretsiz bir kelime sayacı. Bir deneme, bir tweet taslağı, bir meta description veya 4.000 kelimelik bir blog yazısı yapıştırın; kelime, boşluklu ve boşluksuz karakter, satır, paragraf, cümle ve tahmini reading time için canlı sayım alın. Metin makinenizden çıkmaz.
Şu küçük, sık karşılaşılan anlar için var: X'in 280 karakter sınırını 12 karakter aştınız, meta description'ınız 187 karakter ve Google bunu kısaltacak, üniversite başvurunuzda "500 words maksimum" yazıyor ve MS Word'ün word count diyaloğu iki menü altta gömülü duruyor. Yapıştırın, bakın, düzeltin, devam edin.
Saymak göründüğünden daha ilginç bir iş. Kelime sayımı hakkında Wikipedia makalesi aynı belge için MS Word, Pages ve Google Docs'un birbirinden hafifçe farklı sayılar döndürdüğünü, çoğunlukla tireli bileşik kelimeleri, em dashes'i ve satır içi dipnotları her birinin nasıl ele aldığı yüzünden, belirtir. Hangi kuralı kullandığımızı açıkça söylüyoruz, böylece sonucu güvendiğiniz editöre eşleştirebilirsiniz.
Sayımlar gerçekte nasıl çalışıyor
Kelimeler, boşluklarla bölünüp boş girişler dışlanarak sayılır. Bu, MS Word, Google Docs ve çoğu blog platformunun arka planda kullandığı yaklaşımın aynısıdır. Hızlıdır ve İngilizce, Fransızca, İspanyolca ve diğer boşlukla ayrılan diller için yeterlidir. Bedeli: Çince, Japonca, Korece veya Tayca'daki kelimeleri doğru sayamaz, çünkü bu yazı sistemleri kelimeleri boşlukla ayırmaz. Her dilde spec'e uygun kelime sınırları için doğru araç Intl.Segmenter'dır; bu, Unicode UAX #29 (Text Segmentation)'daki algoritmayı uygular. Girdi gerekli görünüyorsa CJK uyarısı gösteririz.
Karakterler iki şekilde sayılır: boşluklu (dizgedeki her code point) ve boşluksuz (ASCII boşluklar, sekmeler ve satır sonları hariç). Hangi sayıyı istediğiniz, kontrol ettiğiniz sınıra bağlıdır. Sayfa başlıkları, meta description'lar ve SMS mesajları boşlukları sayar. Twitter kendi başına bir konu, FAQ'a bakın. Ayrıca grafem kümeleri kullanarak görünür karakter sayısını da raporlarız, böylece 7 code point kapsayan bir aile emojisi insan okuyucu için tek karakter olarak sayılır.
Satır, paragraf ve cümleler paneli tamamlar. Satırlar yeni satır karakteriyle bölünür. Paragraflar boş satırlarla (bir veya daha fazla art arda boş satır) bölünür. Cümleler, ardından boşluk gelen ., ! ve ? ile bölünür ki bu çoğu metin için doğru cevabı verir ama "Mr. Smith said hello"yu iki cümle ve "i.e."yi yeni bir cümlenin başlangıcı olarak yanlış sayar. 200 satır JavaScript'e sığacak güvenilir bir cümle parçalayıcı yok; metniniz kısaltmalarla doluysa cümle sayısını kaba bir tahmin olarak değerlendirin.
Üç adımda kelime nasıl sayılır
Bir metin paneli, altı canlı sayım. Yüklenecek bir şey yok, yüklenecek dosya yok, hesap gerekmiyor.
- 1
Metninizi yapıştırın veya yazın
MS Word, Google Docs, e-posta istemciniz, bir SMS taslağı veya bir CMS editöründen yapıştırın. Veya .txt ya da .md dosyası yüklemek için Upload'a tıklayın. Sample butonu, sayaçların önce hareket ettiğini görmek istiyorsanız bir paragraf yapıştırır. Yapıştırma biçimlendirmeyi temizler, ki bu istediğiniz şeydir; yalnızca metin sayılır.
- 2
Sayımların canlı güncellendiğini izleyin
Yazdıkça veya düzenledikçe her sayım güncellenir. Kelimeler, boşluklu karakterler, boşluksuz karakterler, satırlar, paragraflar, cümleler ve reading time aynı anda görünür. Reading time tahmini genel metin için 230 words per minute kullanır. Ayrıca, boşluk tabanlı kelime sayımının girdinizi az gösterdiği durumlarda uyaran bir CJK detektörü vardır.
- 3
Metni veya sayımları kopyalayın
Temizlenmiş metni panoya geri almak için Copy'ye basın veya belirli bir sayıyı kopyalamak için sayım çiplerini kullanın. Download metni .txt olarak kaydeder. Farklı bir sayım kuralı gerekiyorsa (örneğin, tireli bileşikleri tek kelime olarak ele almak), girdiyi değiştirin ve sayımlar güncellensin; sunucu tarafında yapılandırılacak bir şey yok.
Kelime sayacı ne zaman doğru araçtır
X (Twitter) 280 karakter sınırını yakalamak
Bir thread yazıyorsunuz, ikinci tweet 312 karakter ve şakayı kaybetmeden kısaltmanız gerekiyor. Tweet'i buraya yapıştırın, karakter sayımını izleyin, 280'e veya altına inene kadar kesin. Şunu da bilin: X URL'leri uzunluktan bağımsız 23 karakter, emojileri 2 olarak sayar; saf bir karakter sayımı kalan alanı biraz olduğundan az gösterir. Twitter ağırlıklandırmasıyla ilgili FAQ'a bakın.
Akademik deneme veya üniversite başvurusu kelime sınırları
500 kelimelik bir kişisel ifade, 4.000 kelimelik bir edebiyat denemesi, bir konferans gönderimi için 250 kelimelik özet. Çoğu kurum, boşlukla ayrılmış her token'ı, tireli bileşikler dahil, tek kelime olarak sayar. Bizim raporumuzla örtüşür. Common App deneme sınırı 650 kelimedir ve katı davranırlar; onlardan 10 kelime farklı sayan bir sayaç, gönderildi ile reddedildi arasındaki farktır.
SEO meta description'ları ve sayfa başlıkları
Google sayfa başlıklarını yaklaşık 60 karakterde keser, mobilde bazen daha erken. Meta description'lar yaklaşık 160 karakterde kesilir. İkisi de boşluklar dahil karakter sayımıdır. Taslağınızı buraya yapıştırın, sayacı izleyin, önemli anahtar kelimeler kesim noktasından önce gelene kadar yeniden yazın. Aynı kural Open Graph başlıkları ve Twitter card açıklamaları için de geçerlidir.
SMS ve push bildirim karakter bütçeleri
Standart bir SMS, 7-bit GSM kodlamasında 160 karakterdir; GSM dışı bir karakter (örneğin emoji veya kıvrık tırnak) eklerseniz segment başına 70 karaktere düşer. iOS'ta push bildirimleri kilit ekranı önizlemesinde yaklaşık 178 karakterde kesilir. Metniniz 159 karakterde tek SMS'e sığar ve 161'de ikiye bölünür; sayaç sınırın tam olarak nerede olduğunu söyler.
Bir blog yazısı için reading time tahmini
Medium ve Substack gibi blog platformları makalenin başında bir reading time tahmini gösterir. Standart hesap, toplam kelime sayısının 230'a (genel metin için tipik bir yetişkin okuma hızı) bölünmesi ve yukarı yuvarlanmasıdır. Kod blokları veya matematik içeren teknik içerik daha yavaş gider, yaklaşık 100 words per minute, dolayısıyla tahmin mühendislik yazıları için fazla iyimser çıkar. 1.200 kelimelik bir how-to kabaca 5 dakikalık okumadır.
Düzenleme öncesi ve sonrası kelime sayımlarını karşılaştırma
1.400 kelimelik bir taslak yazdınız ve brief 1.000'in altını istiyor. Orijinali yapıştırın, kısaltılmış sürümü ikinci bir sekmeye yapıştırın ve ne kadar kestiğinizi tam olarak görün. Sadece sayım farkı yerine hangi cümlelerin taşındığını veya yeniden yazıldığını gösteren yan yana diff için compare-text aracımız bu durumu karşılar. İki metriğe de ihtiyacınız olduğunda eşleştirin.
Kelime ve karakter sayımının uç durumları
Çoğu aracın yanıldığı sayım durumları, bizim yaklaşımımız ve dikkat edilmesi gerekenler. Bir sayım garip görünüyorsa cevap genellikle burada.
| Topic | What this tool does |
|---|
| Boşlukla bölme vs Unicode parçalama | Boşluklarla böleriz; bu hızlı ve İngilizce için MS Word/Google Docs ile örtüşür. Spec'e uygun alternatif Unicode UAX #29'dur ve JavaScript'te Intl.Segmenter ile sunulur. Dil kapsamı hızdan daha önemli olduğunda onu kullanın. |
|---|
| Kelimeler arası boşluğu olmayan CJK dilleri | Çince, Japonca, Korece ve Tayca kelimeleri boşlukla ayırmaz. Boşluk sayımı tüm bir paragraf için yaklaşık 1 döndürür. Bu diller için anlamlı metrik karakter sayımıdır ve burada doğru çalışır. Gerçek CJK kelime sayımları için Intl.Segmenter kullanın. |
|---|
| Emojiler ve Unicode code point'leri | Bir aile emojisi 👨👩👧👦 tek karakter gibi görünür ama sıfır genişlikli birleştiricilerle birleştirilmiş 7 UTF-16 code point'idir. İnsan dostu rakam için grafemleri (görünür karakterler) sayar, code point'leri ayrıca raporlarız. Bir thumbs-up üzerindeki ten tonu modifikatörü tek grafemdir ama iki code point'tir. |
|---|
| Twitter / X karakter ağırlıklandırması | X her karakteri ağırlıklandırır: ASCII'nin çoğu 1, emoji ve CJK 2, URL'ler uzunluktan bağımsız 23 olarak sabittir. Karakter sayımız ham karakter sayısıdır. Kullandığınız her emoji için 280'lik bütçeden yaklaşık 7 düşün. |
|---|
| Tweet'lerdeki URL'ler ve @mentions | X gerçek bağlantının uzunluğundan bağımsız olarak her URL'yi t.co üzerinden 23 karaktere düşürür. @mentions birebir uzunluklarıyla sayılır. Sayacımız ham uzunluğu gösterir, dolayısıyla iki uzun URL içeren bir tweet burada X'in raporladığından daha uzun görünür. |
|---|
| Akıllı tırnaklar vs düz tırnaklar | "Kıvrık" ve "düz" tırnaklar farklı Unicode karakterlerdir ama her biri tek karakter olarak sayılır. Çoğu fontta benzer görünürler; MS Word veya Pages'ten yapıştırma genellikle sessizce akıllı tırnaklarla değiştirir. Kod yapıştırıyorsanız, önce geri çevirin. |
|---|
| Sondaki boşluklar ve boş satırlar | Bir satırın sonundaki boşluklar yine karakter olarak sayılır. Belgenin sonundaki bir satır sonu bir satır olarak sayılır. Paragraflar arasındaki boş satırlar satır toplamına eklenir ama paragraf sayımında paragrafları birbirinden ayırır. |
|---|
| Kodlama (UTF-8) ve byte uzunluğu | "Karakter sınırı" diyen API'lerin çoğu Unicode karakterleri kasteder ama bazıları UTF-8 byte'larını kasteder. UTF-8'de bir emoji 4 byte, bir CJK karakteri 3 byte, aksanlı bir Latin harfi 2 byte'tır. Sınırınız byte cinsinden ise karakter sayımız az gösterir. Twitter ünlü ara durumdur: ne byte ne karakter, kendi ağırlıklı şemasıdır. |
|---|
Kelime sayacı: sıkça sorulan sorular
Kelime sayımı ile karakter sayımı arasındaki fark nedir?
Kelime sayımı, metninizdeki boşlukla ayrılmış token'ların sayısıdır; yani "hello world" iki kelimedir. Karakter sayımı, tek tek karakterlerin sayısıdır; yani "hello world" boşlukla 11 karakter, boşluksuz 10'dur. Farklı platformlar farklı sayılarla ilgilenir: akademik denemeler kelime sayımını, SMS ve tweet sınırları karakter sayımını, SEO title etiketleri de karakter sayımını kullanır. Sayaç ikisini aynı anda gösterir, böylece bağlamınıza uygun olanı seçebilirsiniz.
Bu araç kelimeleri tam olarak nasıl sayıyor?
Girdiyi boşluklara (boşluk, sekme, satır sonu) göre böler ve boş olmayan parçaları sayar. Yani "fast-paced" bir kelime, "well known" iki, "isn't" bir kelimedir. İngilizce metin için MS Word ve Google Docs ile örtüşür. Bedeli, Çince, Japonca veya Korece metni doğru ele almamasıdır, çünkü bu diller kelimeleri boşlukla ayırmaz. Her dilde spec'e uygun kelime sayımı için modern tarayıcılar Intl.Segmenter ile gelir; o da Unicode kelime sınırı algoritmasını uygular.
Reading time nasıl hesaplanıyor?
Reading time, kelimelerin 230 words per minute'a bölünmesi ve en yakın dakikaya yukarı yuvarlanmasıdır. 230 wpm, genel metin okuyan yetişkin okuyucular için makul bir orta noktadır; yayımlanmış tahminler teknik olmayan materyal için 200 ila 250 wpm arasındadır. Kod blokları, formüller veya tanıdık olmayan terminoloji içeren teknik yazı, okuyucuları yaklaşık 50 ila 100 wpm'e indirir, bu yüzden tahmin mühendislik veya bilimsel içerikte fazla iyimser çıkar. Niş bir kitle için daha sıkı hesap istiyorsanız, kelime sayınızı onların gerçek okuma hızına bölün.
Çince, Japonca veya Korece metni doğru sayar mı?
Kelimeler için hayır. CJK dilleri kelimeler arasına boşluk koymaz; bu yüzden boşluk tabanlı kelime sayımı bir CJK paragrafı için yaklaşık 1 döndürür. Karakter sayımları yine doğrudur (bir CJK karakteri bir karakterdir) ve bu zaten o diller için genelde önemsenen metriktir: Japonca bir denemenin sınırı kelime değil karakter cinsindendir. Gerçek bir CJK kelime sayımına ihtiyacınız varsa, modern tarayıcılardaki Intl.Segmenter API'si Unicode kelime parçalama algoritmasını uygular ve CJK'yi, Tayca'yı ve diğer boşluksuz yazıları doğru ele alır.
Bir şey kaydediliyor veya yükleniyor mu?
Hayır. Sayaç tamamen tarayıcınızda çalışır. Hiçbir şey sunucuya gönderilmez, loglanmaz veya saklanmaz. Gizli bir taslak, yayımlanmamış bir makale veya vergi beyannamenizi yapıştırıp sekmeyi kapatabilirsiniz; geride bir kopya kalmaz. Doğrulamak için DevTools'u açın, Network sekmesine geçin ve yazarken izleyin. Sayımlar güncellenirken giden istek yoktur. Araç bağımlılıkları konusunda da açıktır; saymayla ilgili tek kod, makinenizde çalışan düz JavaScript'tir.
X (Twitter) gerçekten emojiyi 2 karakter olarak mı sayıyor?
Aşağı yukarı evet. X, çoğu temel Latin'in, rakamların ve yaygın noktalama işaretinin 1 olarak, geri kalan hemen her şeyin (emojiler, CJK, aksanlı karakterler) 280 karakterlik kotanın 2'si olarak sayıldığı özel bir ağırlıklandırma kullanır. Tam algoritma counting-characters belgelerinde; grafem kümeleri yerine code point aralıkları kullanır, bu yüzden bir bayrak emojisi (iki regional indicator code point'idir) aslında 4 olarak sayılır. URL'ler uzunluktan bağımsız 23 karakter olarak özel ele alınır. Bizim karakter sayımımız ham sayımdır, ağırlıklandırılmış değil.
Gizlilik ve nasıl çalıştığı
Metniniz tarayıcınızdan asla çıkmaz. Sayım, bölme ve render etme işlemleri makinenizde çalışır. Metni yüklemiyor, loglamıyor veya üçüncü taraf bir hizmetten geçirmiyoruz. Gizli bir taslağı, yayımlanmamış bir denemeyi veya başka herhangi bir özel içeriği yapıştırıp sekmeyi iz bırakmadan kapatabilirsiniz. Doğrulamak için tarayıcınızın DevTools'unu açın, Network sekmesine geçin ve yazarken izleyin; giden istek yoktur. Tek bağımlılık, tarayıcının kendi JavaScript motoru ve grafem sayımı için isteğe bağlı Intl.Segmenter'dır. Yan yana metin diff'ine, case converter'a, satırları sıralama aracına veya tekrarlanan satır sileceğine ihtiyacınız varsa, o araçlar bir tık ötede ve aynı tarayıcı içi politikayı izler.