pythonなんだけど配列を出力したらunicodeになっちゃったんだけど
■ このスレッドは過去ログ倉庫に格納されています
今日はunicodeの気分なんやろ
明日になればちゃんと出力してくれるやろ 無事解決
まあ多分うまくいくやろ
いま実行中やからちょっとまってな すまんこれ型関係ないかもしれんわ
変な流れ作ってもうてすまん json.dumpの変数にensure_ascii=false >>22
なんgの全スレを巡回しながら一つの配列に名前IDレスを入れる
でそれをjsonとしてローカルに出力する スレ一覧起動
↓
1つ目のスレに遷移
↓
レス全部取得
↓
戻る
↓
2つ目のスレに遷移
まではつくった
あとはこれをforでループさせる >>25
いいたいことはわかる
あまりアクセスしすぎるとgone.になることとかやろ?
それ回避するためにseleniumでやってる >>27
レス取得したら
どんな単語が一番使われてるのか調べてみたい
必死チェッカーやかころぐベータだと詳細には調べられないから自分でやるしかない ワイも5chのレステキスト解析したいわ
イッチもしレス取るの成功したらやり方教えてくれ 2.xで書いたスクリプトあるけど文字列の型変換面倒やったな
3.xやとわかりやすく書けそうやから移植したいんやけどなんか面倒臭くてほったらかしや ページの読み込み終了後の処理をtime.sleepで調整してるのが良くないんだけどほかの関数うまく行かない
なんかいいのはない? >>28
まさにそれ関連のことや
ワイならゴニョゴニョしてdat直接持ってくるね
プログラムで扱いやすいし
5chの負荷軽減のためにも
まああんま大きな声でいうとよくないか unicodeを日本語にしたいってどういうことやねん... >>39
f12おすとファイル一覧が表示されるけどそういうののことかな? 確かにitestのjson取ればgoneないし専ブラAPIと違って完全合法か
統計取るためなら十分そう >>50
itestのAPIならF12でネットワークログ取りながらitest開いてみればわかる
こっそり叩こう 5ch(旧2ch)をスクレイピングして、過去流行ったネットスラングの今を知る
って記事あったけどそれ真似したらええやつやろ いや普通にHTMLで取得してもええか
itestのAPIから取るとかめんどそうやし
seleniumでhtml取るなら5ch運営も広告見てもらえてハッピーやろしな ■ このスレッドは過去ログ倉庫に格納されています