Pythonでフォームに入力したURLからページタイトルを取得したいんやが

**それでも動く名無し** · 2023/02/18(土) 15:04:18.01

調べたらBeautifulSoup 使えばできるんやがスクレイピングは怖い

なんかいい方法ないか

**それでも動く名無し** · 2023/02/18(土) 15:05:25.66

スクレイピングは制約多いしなんか大げさな気がしている

**それでも動く名無し** · 2023/02/18(土) 15:05:52.51

chatGPTに頼めよ

**それでも動く名無し** · 2023/02/18(土) 15:06:20.17

>>3
BeautifulSoup 進められた

**それでも動く名無し** · 2023/02/18(土) 15:06:36.09

aiに聞けよ

**それでも動く名無し** · 2023/02/18(土) 15:07:02.49

全部aiに聞けばコードも出す

**それでも動く名無し** · 2023/02/18(土) 15:07:06.37

タイトル教えてくれるサイトあるぞ

**それでも動く名無し** · 2023/02/18(土) 15:07:18.44

urllibでできんか?

**それでも動く名無し** · 2023/02/18(土) 15:07:26.41

>>7
そういう感じの機能を自分で実装したい

**それでも動く名無し** · 2023/02/18(土) 15:08:28.03

>>4
それなしでってついか質問してみろよ

**それでも動く名無し** · 2023/02/18(土) 15:09:16.53

AIに逆らうなよアホ

**それでも動く名無し** · 2023/02/18(土) 15:10:52.83

ページにアクセスしてタイトル取ったらええやん

**それでも動く名無し** · 2023/02/18(土) 15:10:56.57

任意のWebページのタイトルを取得するってスクレイピングそのものなんだからどんなやり方としてもそれはつまりスクレイピングだぞ

**それでも動く名無し** · 2023/02/18(土) 15:11:39.34

BeautifulSoup使ってスクレイピングしかないやろ…

**それでも動く名無し** · 2023/02/18(土) 15:12:29.37

スクレイピングの何が怖いんや
短時間に大量のアクセスしたりしなければ普通の閲覧となんら変わらんやろ

**それでも動く名無し** · 2023/02/18(土) 15:12:37.20

いやそのリンクにアクセスしないとtitle要素を取得できないんだからスクレイピングするしかないだろ

**それでも動く名無し** · 2023/02/18(土) 15:12:59.64

>>13
そうなん？
URLを入力したらページタイトルを取得してリストにしてくれる機能作りたいんやがこういう使い方で迷惑かかるやろか

**それでも動く名無し** · 2023/02/18(土) 15:13:04.17

ページタイトルとかrequestsでhtmlダウンロードして読ませるだけやろ
スクレイピングの手前や

**それでも動く名無し** · 2023/02/18(土) 15:13:26.34

>>15
気にせなあかんこと多いやん

**それでも動く名無し** · 2023/02/18(土) 15:13:34.65

賢い奴はchatGPTに質問するプログラム組むよ

**それでも動く名無し** · 2023/02/18(土) 15:13:47.79

Pythonあんまり触ったことないがSeleniumのスクレイピングは簡単だったぞ

**それでも動く名無し** · 2023/02/18(土) 15:14:57.08

利用規約見てスクレイピングのこと書いてないかよーく読んだらええ
一秒待てばええやろの精神や

あーあとrobots.txt見てみるの面白いよな

**それでも動く名無し** · 2023/02/18(土) 15:15:14.83

request とurllibどっちがええんやろ

**それでも動く名無し** · 2023/02/18(土) 15:15:18.61

何回も高速に繰り返し取得するならアカンけど1個だけなら人がやってるのと変わら

**それでも動く名無し** · 2023/02/18(土) 15:15:29.53

>>22
その辺がよくわからんから怖いんよ

**それでも動く名無し** · 2023/02/18(土) 15:15:30.84

requestsかurllibでええやんけtitleタグとるだけやろ

**それでも動く名無し** · 2023/02/18(土) 15:15:54.95

chatGPT 様はurllibを勧めてきた

**それでも動く名無し** · 2023/02/18(土) 15:18:48.23

BeautifulSoup 使わない場合は正規表現必須なんかな

**それでも動く名無し** · 2023/02/18(土) 15:19:31.85

BingAIに聞け

**それでも動く名無し** · 2023/02/18(土) 15:20:22.91

html読み込まないといけないんだから結局スクレイピングなんやないん？

**それでも動く名無し** · 2023/02/18(土) 15:21:44.32

seiki = re.compile('title.(.*)..title')
print(seiki.match(html)[1])

ほい、コレ使ってええぞ
ライセンスはGPL3な

**それでも動く名無し** · 2023/02/18(土) 15:23:15.45

学校の課題とかなんか？
車輪の再発明になりそうやけども

**それでも動く名無し** · 2023/02/18(土) 15:24:01.61

>>32
いや個人で作ってるだけ

**それでも動く名無し** · 2023/02/18(土) 15:28:25.46

BeautifulSoup 使うのがいちばん簡単な気がしてきた
逮捕されないスクレイピングの仕方教えてくれ！