中島_backup
の履歴(No.19)
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
]
履歴一覧
差分
を表示
現在との差分
を表示
ソース
を表示
中島_backup
へ行く。
1 (2023-10-05 (木) 16:28:33)
2 (2023-10-05 (木) 16:36:55)
3 (2023-10-12 (木) 15:40:02)
4 (2023-10-13 (金) 14:02:11)
5 (2023-10-20 (金) 14:00:13)
6 (2023-12-05 (火) 15:52:40)
7 (2024-01-19 (金) 13:07:41)
8 (2024-07-05 (金) 13:12:32)
9 (2024-07-05 (金) 13:41:08)
10 (2024-07-10 (水) 10:47:32)
11 (2024-07-17 (水) 12:04:10)
12 (2024-07-19 (金) 15:37:08)
13 (2024-07-24 (水) 12:13:30)
14 (2024-10-07 (月) 10:58:11)
15 (2024-10-21 (月) 11:14:32)
16 (2024-10-28 (月) 11:04:37)
17 (2024-11-11 (月) 12:09:24)
18 (2024-12-02 (月) 11:27:14)
19 (2024-12-04 (水) 19:57:34)
20 (2025-01-06 (月) 05:20:49)
21 (2025-01-25 (土) 06:34:05)
22 (2025-01-26 (日) 18:06:42)
23 (2025-01-26 (日) 22:10:20)
24 (2025-01-28 (火) 04:38:23)
25 (2025-01-28 (火) 16:49:33)
26 (2025-01-29 (水) 16:25:50)
27 (2025-01-30 (木) 17:55:17)
28 (2025-01-30 (木) 18:29:34)
29 (2025-02-04 (火) 06:09:14)
30 (2025-02-14 (金) 17:46:24)
FrontPage
研究会(中島)
専門ゼミ(中島)
引き継ぎ(中島)
メモ(中島)
中間発表(中島)
中間発表システムまとめ(中島)
本論(中島)
B3 前期授業スケジュール
月曜日
火曜日
水曜日
木曜日
金曜日
1-2
研究会
3-4
卒論1
研究会
5-6
卒論1
ディジタル信号処理
卒論1
卒論1
7-8
技術者倫理
9-10
研究会
英語資格試験ゼミ
11-12
メモ
離散選択モデル 支払い意思 どんな条件があれば他の条件よりもお金を払えるか ヘドニックアプローチ 価格に影響を与える要因を分析する 離散選択モデル どのような属性の組み合わせが消費者に選ばれやすいのかを分析。 価格だけでなく、消費者選好の観点から選択確率を考慮することが可能 交絡因子の影響を排除することはできない。 →操作変数法を利用することで、未観測の交絡因子が存在しても、対象の要因・効果を推定する方法。 どのような消費者がある属性に対して強い選好を持っているか →構造推定 3.3限界支払い意思額 変数選択法 種類 全探索法 逐次選択法 (前進選択法 後退選択法 ステップワイズ選択法) 正則化法 (リッジ回帰 ラッソ回帰 Elastic Net) 相関分析 主成分分析 boruta法 AIC/BICの最小化
やること
import requests from bs4 import BeautifulSoup import pandas as pd import time # ヘッダー設定 headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36" } # 賃貸物件情報を格納するリスト properties = [] # 一覧ページのURLテンプレート list_page_url_template = "https://suumo.jp/jj/chintai/ichiran/FR301FC005/?ar=040&bs=040&ta=16&sc=16201&cb=0.0&ct=9999999&mb=0&mt=9999999&et=9999999&cn=9999999&shkr1=03&shkr2=03&shkr3=03&shkr4=03&sngz=&po1=25&po2=99&pc=100&page={}" # 各物件の詳細ページから部屋情報を取得する関数 def get_room_details(detail_url): response = requests.get(detail_url, headers=headers) soup = BeautifulSoup(response.text, "html.parser") # 物件概要の情報 property_details = {"物件URL": detail_url} # アクセス情報 access_section = soup.find("div", class_="section_access") property_details["アクセス"] = access_section.get_text(separator=", ", strip=True) if access_section else "情報なし" # 各部屋の情報を取得 room_list = [] room_table = soup.find_all("div", class_="cassetteitem_other") for room in room_table: room_info = property_details.copy() # 基本情報をコピー room_info["家賃"] = room.find("span", class_="cassetteitem_other-emphasis").get_text(strip=True) room_info["管理費"] = room.find_all("span", class_="cassetteitem_price--administration")[0].get_text(strip=True) room_info["敷金"] = room.find_all("span", class_="cassetteitem_price--deposit")[0].get_text(strip=True) room_info["礼金"] = room.find_all("span", class_="cassetteitem_price--gratuity")[0].get_text(strip=True) room_info["間取り"] = room.find("span", class_="cassetteitem_madori").get_text(strip=True) room_info["専有面積"] = room.find("span", class_="cassetteitem_menseki").get_text(strip=True) room_list.append(room_info) return room_list # 一覧ページの各物件から部屋情報を取得 for page in range(1, 101): list_page_url = list_page_url_template.format(page) response = requests.get(list_page_url, headers=headers) soup = BeautifulSoup(response.text, "html.parser") # 一覧ページから物件の詳細URLを取得 property_links = soup.find_all("a", class_="js-cassette_link_href") for link in property_links: detail_url = "https://suumo.jp" + link.get("href") # 各物件の部屋情報を取得 try: room_data = get_room_details(detail_url) properties.extend(room_data) # 各部屋情報をリストに追加 print(f"取得完了: {detail_url}") except Exception as e: print(f"エラー: {detail_url}, {e}") # リクエスト間隔を設定(サーバーへの負荷を避けるため) time.sleep(1) # 次の一覧ページに進む前に待機 time.sleep(3) # データをCSVに保存 df = pd.DataFrame(properties) df.to_csv("富山市_賃貸部屋情報.csv", index=False, encoding="utf-8-sig") print("スクレイピング完了。CSVファイルに保存しました。")