#author("2024-02-29T02:22:10+00:00","","") #author("2024-02-29T02:23:13+00:00","","") [[中市]] [[引継ぎメモ 中市]] *勉強計画プログラムの引継ぎ [#w1274653] python 3.11で実行確認済み iie.lab.tpu.2324にアクセス. 中市のページを開く,それを前提にして話す.~ **mecab [#tcd4a843] -Mecab(形態素分析を行うモジュール)をインストールする(リンク先の.exeのみ) --PythonのMeCabをpipした後には、PC本体にも入れる必要がある https://github.com/ikegami-yukino/mecab/releases/tag/v0.996 -パスを通しておく(システム環境変数の編集で変数Pathを編集する) -新規でmecab.exeがあるパスを追加する C:\Program Files\MeCab\bin\ ~ *** MeCabを試す[#nb96e344] -試しにmecabと打った後、「形態素解析」と打ってみる --何か出てEOSが表示されていればOK -pythonでもmecabを試す --下図の4行をJupyterにコピペして態素解析結果が出ればOK import sys import MeCab m = MeCab.Tagger ("-Ochasen") print(m.parse ("東京特許許可局")) ~ ** 辞書の更新[#q0bc128b] 文章から不必要な文字列を除去し,Mecabの辞書に基づいて単語単位に分割する -インストールしたMecabには古い辞書しか入っていないので、NEologdという新しい辞書を追加する //-C:\Program Files\MeCab\dic 内に配布フォルダ内dicの中のneologdをコピーする //--MeCabをPCにインストールすると基本Program Filesの中に入る? -GoogleDrive(iie.lab.tpu.1920)の平松さんのページに行き、「neologd.zip」をDLする -解凍したneologdの中身のmecab-ipadic-neologdをdicのフォルダにコピーする --dicの中でipadic-UTF8を作成しipadicの中身を全部コピぺする --同様に空のフォルダneologdも作成する -管理者権限でコマンドプロンプトを起動し(管理者として実行),ipadic-UTF8のディレクトリに移動し,ipadicの中身をUTF8に変換する cd "c:\Program Files\MeCab\dic\ipadic-UTF8" mecab-dict-index -f utf-8 -t utf-8 -Neologdの辞書をコンパイルする cd "c:\Program Files\MeCab\dic\mecab-ipadic-neologd\seed" mecab-dict-index -d "c:\Program Files\MeCab\dic\ipadic-UTF8" -u NEologd.20200820-u.dic -f utf-8 -t utf-8 mecab-user-dict-seed.20200820.csv -mecab-ipadic-neologdのフォルダ内に作られた「NEologd.20200820-u.dic」を先ほど作った空のneologdフォルダに移動させる -Program Files/MeCab/etcの中にあるmecabrcをメモ帳で開き,下の一行を追加する ; userdic = /home/foo/bar/user.dic userdic = C:\Program Files\MeCab\dic\neologd\NEologd.20200820-u.dic -- エラー対応(mecabrcを上書き保存する際、「アクセス許可がない」という旨のメッセージが出るとき --右クリックでmecabrcのプロパティを開き、Usersの「書き込み」にチェックを入れる ***辞書(dic)について[#xb395eab] -どのような単位で単語を区切るかなどのルールを記したもの -辞書はなるべく頻繁に更新したほうがいい --デフォルトの辞書(2007年版?)では「進撃の巨人」に対して「進撃 の 巨人」という分析をしてしまう~ --辞書を日々更新することで流行語などを正確に1つの単語として分析してくれる *** 形態素解析について[#t7b5c738] -形態素解析:文章を意味のある最小単位の単語(形態素)に分解し、単語間の関係性を分析(自然言語処理の一種) -形態素解析ツールは複数あるが、今回は「Mecab」を使用 **スクレイピング関連 [#i3c68376] スクレイピング.zipをダウンロード keyword.csvを書き換えると検索ワードが変化する. ***Google Driver [#h860cb3d] chromeを使ったスクレイピング,実際に画面が現れ遷移するのが特徴~ chromeは勝手に更新するので常に最新版になっている~ そのためdriverも常に更新し続けなければならない~ [[ここからchromeのバージョンにあったものをダウンロードする>https://googlechromelabs.github.io/chrome-for-testing/#stable]]~ 一回サイトの場所が変わってるので,また変わるかもしれない 注意~ pipでインストールすることもできるだろうが,わかりやすいしスクレイピング実行ディレクトリに入れとくだけでもいい.~ sakusei_sale.pyを実行 ***youtube api v3 [#ke4fbce5] youtubeのスクレイピングを一瞬でできるapi~ apiキーが必要になる~ [[apiキー取得方法>https://zenn.dev/eito_blog/articles/94dc874c112c9f]]~ Google Cloud Platformにアクセスします。 プロジェクトの選択をクリックします。 初めて作成される方は「プロジェクトの選択」となっている可能性があります。 ***プロジェクト作成 [#sdb50634] 任意のプロジェクト名を入力し、作成ボタンをクリックします。 ***作成したプロジェクトの選択 [#o01d918c] 再度添付画像赤枠の部分をクリックします。 作成したプロジェクトをクリックします。 ライブラリをクリックします。 ***YouTube Data API v3の有効化 [#d02ab49a] 検索窓に「youtube」と入力し、検索候補で出てくる「youtube data api v3」をクリックします。 YouTube Data API v3をクリックします。 有効にするをクリックします。 ***API作成 [#j18baf9f] 認証情報をクリックします。 認証情報を作成をクリックします。 APIキーをクリックします。 ポップアップにYouTube Data v3 APIキーが発行されます。 このAPIキーを使用することによりプログラムを利用して動画情報やチャンネル情報の取得ができるようになります。 以上でYouTube APIの作成は終わりです。 api_keyを自分で取得したものに書き換えてvideo_sakusei.pyを実行 make_database.pyを実行することで,app.pyで使えるファイルに変化する. 結果できたものの例が教材データ.zip **html作成関連 [#i3c68376] 膨大な量のhtmlが必要であるので繰り返しを使ってhtmlを作っている. ドライブからhtml作成.zipをダウンロードする first/html.pyは教材ページに飛ぶまでの中間地点をつくる.~ 派生するならここにキーワードを入れるといいとおもう. second/kyouzai.pyは教材ページを作る 作科目単元カテゴリ,理解度作成.zipをダウンロードし, rikai_sakusei_?.pyを実行するとメインプログラム/app/templatesのrikai?.htmlが作成される. ~ **メインプログラム [#t02c6b47] メインプログラム.zipをダウンロード python app.py で実行~ その後ローカルホスト http://127.0.0.1:5000 にアクセス. 実行できなかった時必要なモジュールを入れる. 実行できればhtml作成サンプル.zipや,教材データ.zipを展開し, メインプログラム上に上書き保存 **補足資料 [#m8d07d36] #ref(プレゼンテーション1.pdf,,データ攻略本) を読む ドライブ内の動画を見て,システムの動きを確認~ 発表資料をみて,システムの大まかな動きを確認.~ それでもいまいちわからなければ仕方ないので本論を確認. **データ整理 [#b3fb5a7c] #ref(1.png,,30%) #ref(2.png,,30%) #ref(3.png,,30%) #ref(4.png,,30%) #ref(5.png,,30%) #ref(6.png,,30%) #ref(7.png,,30%) #ref(8.jpg,,30%) **システムの操作ガイド [#sb629777] ***実際に使用したシステムの操作ガイド [#bfac56e8] 1. 新規登録画面で,ユーザ ID,パスワード,ニックネームを入力してください.(図 5.1 参照)~ 2. 登録したユーザー情報を使用してログインしてください.~ 3. 右上の画面で勉強可能な時間帯をクリックして選択してください.入力 完了後,「合計時間を保存」ボタンを押して保存してください.~ 4. 左下の画面で「予定追加」ボタンを押して,表示される青いボックスをドラッグして 次のテストの日程に配置してください.配置が完了したら,「書き込み」ボタンを押し て保存してください .~ 5. 「理解度チェック」ボタンから好きなものを選択し,単元のバーを動かしたりチェッ クボックスをつけたりしてください.~ 6. 再ログイン後,「スケジュール日程作成」ボタンを押して,表示されたカレンダーの日 付をクリックして確認してください.~ 7. 「系統図グラフ作成」ボタンを押して,プルダウンメニューから理解度チェックで登 録した科目を確認してください.グラフに理解度とテスト期間,クリティカルパスが 反映されていることを確認してください.~ 8. グラフで好きなノードから出るボックスをクリックし,教材メニューに移動してくだ さい.レビューと評価を行い,教材の信頼度スコアが変化することを確認してください. [[中身>中身.nakaihci]]