indent
可以噁心其實我交往謝,看到一個不是⋯時還麼看晚開心或是都會是那種。感覺因為到這,最重作的次都抽點會是⋯他恢復生氣⋯要個,悠仁了下就不也都是⋯有點小過還是也。
發現就之後我落:我的才知道,控制種同事後就是,真的不著這,供一直都我快我整個⋯也想我才不有也覺投幣了月心了。突然覺但覺得,常會特別概是這時候要,的但我家問想說。
超可愛是這樣觀察老師,用的一瞬自己試不知道。忽然道他辦法以前不麼是大概是⋯就一更多一點容,人的,我只:附近這種定是,老體驗是我。
這是什麼鬼東西?
一段乍看之下像是文章,但仔細一瞧全無道理的文字組合。
這能幹嘛?
給做版面設計的人在版面上塞入一些文字,觀察版面填入文字之後的效果。
另外,有些人以看這種東西為樂。
誰這麼無聊?
這個人。
有沒有其他類似的東西?
當然有:
MoreText(注意網址改了,要打 more.iter.tw/sentenc...)
有沒有 API 可以用?
支援參數:
format: html、plain、json,輸出格式,預設為 html
size: 1~2000 的正整數,預設為 200
type: 文字類型,預設為 default(白話文)。支援類型如下:
default(白話文)
wenyan(文言文)
poem5(五言詩)
poem7(七言詩)
name(姓名)
miew(「喵」)
wala(「哇啦」)
wenzi(「文字」)
範例:
# 直接取得純文字curl -s 'https://textgen.cqd.tw?format=plain&size=300'# 取得 JSON 格式回應curl -s 'https://textgen.cqd.tw?format=json&size=500' | jq -r .text
假文怎麼做的?
蒐集大量中文文章,排除非文字符號後算出 1-gram / 2-gram / 3-gram 的頻率統計,把三者次數加權(3-gram 出現十次的意義比 1-gram 出現十次大得多)之後取出加權分數前一萬名。最後以分數為準做加權隨機取樣,連續取到文字數量足夠為止。
標點符號與斷行則是每次取字之後丟骰子決定,機率高低是憑感覺亂設。