A096dc70c834c37a3926d18a6ef257b4

2019-04-12 slaveveveCreated on 2019-04-12 by slaveveve

    今日やったこと

    • ドメイン説明受けた
    • データ整形

    所感

    • 渡されたデータの説明受けた
      • これ特徴量として使えそうだな!ってあてにしてたやつがあてにできなさそうだったり、規則性ありそうだからダミー変数として分けられそうだな!って思ってた各種業務コードが気分で入力されたりしてて使えなさそうなことが分かりきびしいきもちになった。
    • データ整形はとりあえず商品別でGROUP BYして時系列データに直そうかなというところやってる
      • 商品数5桁あるんだけどこいつらどうやってこれから処理していこうか…。
      • とりあえずその辺の検討もしたいので可視化していく
    • まだ正式には未確定ですが、kaggleコンペでシルバーメダル取れてそうです…(top5%ってなってるコンペのやつです)
      • 正直無理だと思ってたので本当にびっくりしてる……
      • おまけにチームでやってたんだけど後半何もしなかったのでタダ乗りしちゃった感が半端ない。サーセン。
      • 思い返すと色々と闇の深いコンペだったけどとりあえずひとつ実績と言えるものを作れてよかったなという気持ち。あと次もやってみるかってモチベになった
      • 個人的にもっとも大きな教訓は欠損値がないからといって良いデータセットとは限らないってのと、どれだけ特徴が増えてもカラムに相関が見られないと地獄を見るということでした

    来週やること

    • データ整形