2020年12月6日 / 最終更新日時 : 2026年3月20日 pep データサイエンス Google Colabで長時間実行する方法(Hyperdash) 機械学習をクラウドで実行できるGoogle Colab 機械学習を行うのに、メモリやCPU/GPUを増強が必須ですが、Googleがブラウザ上で動作するJupyter notebook環境Google Colabを無料で […]
2020年6月19日 / 最終更新日時 : 2026年3月20日 pep アナリティクス スプレッドシートとGoogle Apps ScriptでBigQueryを監視 分析データも監視が必要 データ分析用のテーブルやGoogle Analytics、FirebaseなどからBigQueryにインポートされたテーブルが更新されていなくて、分析結果が狂ってしまったって事はありませんか?特に […]
2020年6月9日 / 最終更新日時 : 2026年3月20日 pep データサイエンス jupyter notebookでUntitledファイルを自動生成しない 以前の記事で、jupyter notebookで自作したクラスを自動でimportする方法を紹介しました。この機能はjupyter notebook上でスクリプトを保存するたびにpythonファイルやhtmlファイルを自 […]
2020年5月12日 / 最終更新日時 : 2026年3月20日 pep データサイエンス 学習曲線(Learning Curve)で過学習、学習不足を検証 前回はvalidation_curveでパラメータの範囲を絞り込む方法を使ってGridSearchCVの実行時間削減に挑戦しました。各パラメータの最適値についてはGridSearchCVで求めることはできるようになりまし […]
2020年5月8日 / 最終更新日時 : 2026年3月20日 pep データサイエンス validation_curveでGridSearchCVとRandomForestClassifierのパラメータチューニング 前回はGridSearchCVを使って、ランダムフォレスト(RandomForestClassifier)のパラメータの最適解を求めました。 「GridSearchCVを使えば、いつでも最適解を出せるから楽だよね」 と思 […]
2020年5月5日 / 最終更新日時 : 2026年3月20日 pep データサイエンス matplotlib.pyplotの’str’ object is not callableエラー 謎のエラー ‘str’ object is not callable Pythonでグラフを作成するときによく使うmatplotlib.pyplotですが、ある時、何気なくいつもどおりラベルを表示 […]
2020年5月3日 / 最終更新日時 : 2026年3月20日 pep データサイエンス KaggleのTitanic課題をGridSearchCV+RandomForestClassifierで挑戦 前回はRandomForestClassifierでTitanic課題に挑戦しましたが、その前に行ったDecisionTreeClassifierよりも悪い結果となってしまいました。通常はRandomForestClas […]
2020年5月1日 / 最終更新日時 : 2026年3月20日 pep データサイエンス RandomForestClassifierでKaggle Titanicに挑戦 前回はKaggleのTitanicの課題に決定木(DecisionTreeClassifier)で挑戦して、76.5%の精度を出しました。 今度はランダムフォレスト(RandomForestClassifier)を使って […]
2020年4月28日 / 最終更新日時 : 2026年3月20日 pep データサイエンス jupyter notebookで自作したクラスを自動でimport jupyter notebookで自作したクラス(モジュール)をインポートできない Pythonは自分で作成したクラスを簡単にインポートできます。 from ファイル名 import クラス名 ですが、jupyter n […]
2020年4月24日 / 最終更新日時 : 2026年3月20日 pep データサイエンス 機械学習初心者がKaggleのTitanic課題でモデルを作る 機械学習の挑戦者が集まるKaggle 機械学習初心者だったら、「Pythonでモデリングの勉強はして機械学習を実際にやってみたいけど、データがない」と悩んだことはありませんか? そんなあなたにおすすめしたいのがKaggl […]
2020年2月15日 / 最終更新日時 : 2026年3月20日 pep データサイエンス Jupyter Notebookがショートカットアイコンから起動しない Googleにて調べてみてください。 今回はWindowsでこのJupyterNotebookが起動しない場合の解決策について紹介します。 まず、Jupyter Notebookの起動方法としていくつかあります。 Ana […]
2017年4月29日 / 最終更新日時 : 2026年3月20日 pep データサイエンス mySQLやSQLserverでDATETIMEの最小値・最大値の違い DATETIME型 SQLとひとことで言ってもOracleやPostgreSQL、DB2、mySQL、SQLserverといろいろあるのですが、データの移し変えをしていてどうもうまくいかないと思っていたらDATETIME […]
2013年12月12日 / 最終更新日時 : 2026年3月20日 pep データサイエンス DMPは自社データだけではわからない新規顧客を獲得するヒント【書評】 DMP(データマネジメントプラットフォーム)の2つの定義 本書によればDMPの定義は主に2つあり、後者のプライベートDMPはWebでのCRMといった感じでしょうか。 ・広告配信対象となるオーディエンスデータを販売する事業 […]
2013年12月11日 / 最終更新日時 : 2026年3月20日 pep データサイエンス 【書評】これからのデータサイエンティストに必要なのは分析力ではなく実行力! 分析はビジネスに貢献できてはじめて結果となる 日経情報ストラテジーが選ぶ第1回データサイエンティスト・オブ・ザ・イヤーを受賞した河本薫氏が考える分析屋にとって本当に必要な事がまとめられている。 昨今、「ビッグデータ」や「 […]