python 3.11で実行確認済み
iie.lab.tpu.2324にアクセス.
中市のページを開く,それを前提にして話す.
MeCab は日本語の形態素解析エンジンの一つで、文章を単語(形態素)ごとに分割し、それぞれの品詞を解析するツール
MeCabは、自然言語処理の分野で広く利用されており、形態素解析が必要な検索エンジン、機械翻訳、テキストマイニングなどに役立つ
https://github.com/ikegami-yukino/mecab/releases/tag/v0.996
C:\Program Files\MeCab\bin\
文章から不必要な文字列を除去し,Mecabの辞書に基づいて単語単位に分割する
cd "c:\Program Files\MeCab\dic\ipadic-UTF8" mecab-dict-index -f utf-8 -t utf-8
cd "c:\Program Files\MeCab\dic\mecab-ipadic-neologd\seed" mecab-dict-index -d "c:\Program Files\MeCab\dic\ipadic-UTF8" -u NEologd.20200820-u.dic -f utf-8 -t utf-8 mecab-user-dict-seed.20200820.csv
; userdic = /home/foo/bar/user.dic userdic = C:\Program Files\MeCab\dic\neologd\NEologd.20200820-u.dic
スクレイピング.zipをダウンロード
keyword.csvを書き換えると検索ワードが変化する.
chromeを使ったスクレイピング,実際に画面が現れ遷移するのが特徴
chromeは勝手に更新するので常に最新版になっている
そのためdriverも常に更新し続けなければならない
ここからchromeのバージョンにあったものをダウンロードする
一回サイトの場所が変わってるので,また変わるかもしれない 注意
pipでインストールすることもできるだろうが,わかりやすいしスクレイピング実行ディレクトリに入れとくだけでもいい.
sakusei_sale.pyを実行
youtubeのスクレイピングを一瞬でできるapi
このAPIキーを使用することによりプログラムを利用して動画情報やチャンネル情報の取得ができるようになる。
video_sakusei.py の api_key を取得したものに書き換えて実行
make_database.pyを実行することで,app.pyで使えるファイルに変化する。
例として作成したものが "教材データ.zip" である。
膨大な量のhtmlが必要であるので繰り返しを使ってhtmlを作っている.
ドライブからhtml作成.zipをダウンロードする
first/html.pyは教材ページに飛ぶまでの中間地点をつくる.
派生するならここにキーワードを入れるといいとおもう.
second/kyouzai.pyは教材ページを作る
作科目単元カテゴリ,理解度作成.zipをダウンロードし,
rikai_sakusei_?.pyを実行するとメインプログラム/app/templatesのrikai?.htmlが作成される.
メインプログラム.zipをダウンロード
python app.py
で実行
その後ローカルホスト
http://127.0.0.1:5000
にアクセス.
実行できなかった時必要なモジュールを入れる.
実行後に、スクレイピング等を省略したい場合は "html作成サンプル.zip","教材データ.zip"をメインプログラム内に上書きすることで利用可能になる。
システム全体に関する解説資料
ドライブ内の動画を見て,システムの動きを確認
発表資料をみて,システムの大まかな動きを確認.
それでもいまいちわからなければ仕方ないので本論を確認.
1. 新規登録
2. ログイン
3. 学習可能時間の設定
4. テスト日程の追加
5. 理解度チェック
6. スケジュール確認
7. 系統図グラフの作成
8. 教材のレビューと評価