New Fashion Machine +

ファッション専門ブックマーク New Fashion Machine の補足説明です。

ファッションに関するブックマークデータ約16万件をワードクラウドにしてみたよ その3

前回からの続きです。

f:id:girls_fashion:20180124191546p:plain

データ:30001〜32500件
日付け:b:id:girls_fashion:20080412b:id:girls_fashion:20080428

とにかくセレクトショップ

f:id:girls_fashion:20180124192518p:plain

データ:32501〜35000件
日付け:b:id:girls_fashion:20080428b:id:girls_fashion:20080519

ただひたすらにセレクトショップを追いかけていたようです。

f:id:girls_fashion:20180124192833p:plain

データ:35001〜37500件
日付け:b:id:girls_fashion:20080519b:id:girls_fashion:20080626

あれ、ハンドメイドが大きいぞ?37500件目はちょうどギャルソンとH&Mがコラボした頃。

f:id:girls_fashion:20180124193238p:plain

データ:37501〜40000件
日付け:b:id:girls_fashion:20080626b:id:girls_fashion:20080918

ファッションブランドのブログを追いかけていたようです。

f:id:girls_fashion:20180124193652p:plain

データ:40001〜42500件
日付け:b:id:girls_fashion:20080918b:id:girls_fashion:20081004

ブランドとセレクトで割れた感。

f:id:girls_fashion:20180124193930p:plain

データ:42501〜45000件
日付け:b:id:girls_fashion:20081004b:id:girls_fashion:20081101

これでもかというぐらいセレクトショップを追いかけていた様子。雑貨もさりげなく大きいですね。

次いきます!

ファッションに関するブックマークデータ約16万件をワードクラウドにしてみたよ その2

シリーズ第2回です。画像が似すぎてて自分でもどれがどれかわからなくなりそうです。

f:id:girls_fashion:20180124173959p:plain

データ:15001〜17500件
日付け:b:id:girls_fashion:20070818b:id:girls_fashion:20070925

よーく見るとYOMIURI ONLINEやみんなの経済新聞ネットワークさんをよくブックマークしていたことがわかります。「ユニ クロ」て。企業名で入ってくるのってユニクロぐらいじゃないかな。私がニュースを意識的に追っかけてたってのもあると思いますが。あとはファッション企業があまり辞書に登録されてないとか?

f:id:girls_fashion:20180124175017p:plain

データ:17501〜20000件
日付け:b:id:girls_fashion:20070925b:id:girls_fashion:20071013

「男性」の文字が大きい気がする。こっちにも「ユニ クロ」ってあります。

f:id:girls_fashion:20180124180015p:plain

データ:20001〜22500件
日付け:b:id:girls_fashion:20071013b:id:girls_fashion:20071107

livedoor Blogに続いてYahoo!ブログの文字も見えます。

f:id:girls_fashion:20180124181128p:plain

データ:22501〜25000件
日付け:b:id:girls_fashion:20071107b:id:girls_fashion:20080128

雑貨とアクセサリーの文字が大きいです。服飾小物に興味があったのかな。

f:id:girls_fashion:20180124181520p:plain

データ:25001〜27500件
日付け:b:id:girls_fashion:20080128b:id:girls_fashion:20080212

Yahoo!ブログに続き楽天ブログの文字が。店長ブログに興味があったのかも。

f:id:girls_fashion:20180124181936p:plain

データ:27501〜30000件
日付け:b:id:girls_fashion:20080212b:id:girls_fashion:20080412

どんだけファッション強調したいのかと。笑 よく見るとパーソナルカラーの文字が。この頃は色彩に興味があったのかな?

次々行きます。

ファッションに関するブックマークデータ約16万件をワードクラウドにしてみたよ その1

こんにちは。一回に5000件も無理があったようで2500件に分けることにしました。今回は全8回に分けて行こうと思います。画像なしより華がある!が、日常系4コマのように同じような画が淡々と続きます。読む方は間違い探しのつもりで読んでください。それではどうぞ!

f:id:girls_fashion:20180124144153p:plain

データ:1〜2500件
日付け:b:id:girls_fashion:20060208b:id:girls_fashion:20060904

今から約12年前。ファッションという字がでかでかと出てますね。いいぞ、それっぽいぞ!mixiが流行ってた時期かな?SNSというタグがちらりと見えますね。

f:id:girls_fashion:20180124145148p:plain

データ:2501〜5000件
日付け:b:id:girls_fashion:20060904b:id:girls_fashion:20070126

バレンタインという字が小さくあるのはバレンタイン商戦を追っかけてた時期があったからでしょう。モテやセレブが全盛期でした。エコ バッグと大きく入ってるのは、この年にエコバッグ騒動という社会現象があったからです。

f:id:girls_fashion:20180124151807p:plain

データ:5001〜7500件
日付け:b:id:girls_fashion:20070126b:id:girls_fashion:20070307

こっちにもバレンタイン入ってますね。今見てもほとんどNotFoundでしょう。

f:id:girls_fashion:20180124152303p:plain

データ:7501〜10000件
日付け:b:id:girls_fashion:20070307b:id:girls_fashion:20070511

教えgoo。笑 ご存知「教えて!goo」をよくブックマークしていたらしい。コトノハは健在だ。phpで個人サービスを作るのが流行り出してたと記憶。

f:id:girls_fashion:20180124153022p:plain

データ:10001〜12500件
日付け:b:id:girls_fashion:20070511b:id:girls_fashion:20070611

ちょうど一ヶ月間のデータみたいです。とにかくセレクトショップのブログをブクマしまくってた様子。ブログサービスとしてはlivedoor Blogが目立ってる。

f:id:girls_fashion:20180124153554p:plain

データ:12501〜15000件
日付け:b:id:girls_fashion:20070611b:id:girls_fashion:20070818

15000件目にちょうどセカンドライフの記事が。時代を感じますね。セレショブームは続くよどこまでも。

駆け足で見て見ましたがいかがだったでしょうか。当時のブックマーカーさんたち元気かな。それでは次回!

ファッションに関するブックマークデータ約16万件をPythonで形態素解析したよ 動詞編

タイトルの通りでございます。前回と同じくデータが大きすぎてワードクラウド作れず。今までで一番地味かもです。ストップワードというやつをうまいこと設定するべきなんでしょうけど知識が及ばず。

それでは頻出ワード1位から100位までをどうぞ!左の数字が順位、右の数字が出現回数となっております。

1 し 156876
2 する 46674
3 い 40438
4 いる 34944
5 れ 30598
6 さ 28219
7 ある 18376
8 なっ 15228
9 なる 12923
10 おり 12691
11 あり 11981
12 き 11078
13 なり 10564
14 ください 10154
15 れる 9172
16 せ 8256
17 いたし 6961
18 見 6830
19 でき 6680
20 み 6672
21 見る 6295
22 てる 6222
23 できる 5974
24 行っ 5925
25 いき 5650
26 下さい 5335
27 思い 5202
28 着 4857
29 られ 4395
30 思っ 4032
31 致し 3920
32 あっ 3685
33 いただき 3630
34 使っ 3331
35 来 3218
36 て 3055
37 作っ 2859
38 送る 2812
39 いう 2729
40 っ 2607
41 書い 2606
42 やっ 2534
43 頂き 2392
44 くれ 2386
45 出 2280
46 持っ 2243
47 思う 2240
48 始め 2227
49 られる 2200
50 いく 2176
51 買っ 2162
52 贈る 2145
53 合わせ 2140
54 しまい 2134
55 いただい 2115
56 入っ 2063
57 行わ 2043
58 感じ 1982
59 考え 1982
60 いっ 1914
61 集め 1884
62 教え 1787
63 みる 1760
64 す 1752
65 しまう 1672
66 出来 1670
67 しまっ 1657
68 くれる 1631
69 ち 1593
70 いえ 1575
71 せる 1563
72 着る 1525
73 頂い 1514
74 持つ 1511
75 受け 1510
76 向け 1498
77 つけ 1488
78 働く 1474
79 答える 1465
80 入れ 1458
81 行く 1444
82 言う 1444
83 作る 1443
84 探し 1431
85 つかっ 1430
86 くる 1405
87 かけ 1386
88 しよ 1379
89 言っ 1361
90 増え 1352
91 知ら 1352
92 言わ 1350
93 行き 1316
94 続け 1306
95 いただけ 1274
96 いただく 1272
97 楽しむ 1271
98 聞い 1225
99 食べ 1213
100 迎え 1211

そこかしこにアパレル店員さんっぽい言い回しが感じられますね。ですが28位、72位で「着」の文字が出なければなんの業界かわからない感じです。

品詞ごとの抽出は終わりにして、元データ5000件ずつからワードクラウドを作ってみようかな?と思います。今のやり方だと5000件ぐらいずつなら画像生成できるようですので。次回からはMeCabを使うので少し新しいワードも入るかも?何回かにまとめてお送りいたします。

ブックマークデータを2万件ずつPythonで形態素解析 名詞編 総合

名詞編のトータルも出してみました。形容詞とは違いデータが大きすぎたのかワードクラウドは出せず…。機会があれば出してみたいと思います。

  • ランキングは主に名詞(名詞じゃないのも混ざってます)
  • 100位までカウントしてみました
  • 記号や数字などのノイズは飛ばしてます
  • 前の数字は順位
  • 後ろの数字は出現回数

以下、約16万件トータルでの名詞抽出結果です。

7 ファッション 94076
8 ブログ 88812
10 店 60140
19 ブランド 38639
20 ショップ 32021
24 の 27901
25 さん 27387
26 こと 26215
28 情報 25316
32 商品 23413
35 紹介 20571
36 人 20031
38 市 19194
39 中 18988
40 セレクト 18152
42 県 16776
43 販売 16039
45 雑貨 15289
46 東京 14752
47 サイト 14638
48 女性 14578
52 よう 13825
54 服 13812
55 日本 13339
57 ♪ 13130
60 円 12529
61 ニュース 12404
64 的 12134
65 イベント 12079
69 デザイン 11678
70 2009 11588
72 アイテム 11378
73 方 11299
74 shop 11040
75 株式会社 11035
76 説明 10902
77 記事 10558
78 入荷 10341
79 モデル 10315
81 人気 10155
82 今日 9930
84 区 9818
85 開催 9758
88 オープン 9577
90 ん 9494
91 発売 9427
92 入力 9357
93 写真 9305
94 日記 9302
97 私 9263
98 アクセサリー 9186
99 プロフィール 9140
100 さ 9120

以上でした。2009年がブックマークのピークみたいですね。いつかなんかの形で盛り返したい。笑

ファッション記事の形態素解析は形容詞の方が面白かった 総合

f:id:girls_fashion:20180122131453p:plain

18.02.22 追記:ワードクラウドができました!いやー苦労した。と言ってもまた他の方のコードを使わせていただいたんですがね。字がガタガタなのはご愛嬌。これから整え方勉強します。丸ゴでしかできなかったのはなぜ。

ファッション関係のブックマークの概要を解析してみたよ 形容詞編 も最終回。今回は約16万件トータルで頻出ワードランキングを出してみました。

最初っからこれできたら良かったけど、分割したことでその時その時の結果が違って出て来たのが面白かったため良しとします。もっと言うと、ある期間、あるドメインに限ってなど設定するとまた違う結果が見られるんでしょうね。

では1件〜約16万件目の100位までの頻出ワードランキングをどうぞ!前の数字は順位、後ろの数字は出現回数となっております。

1 なう 6286
2 いい 5424
3 ない 5291
4 新しい 3841
5 多い 3402
6 かわいい 3087
7 可愛い 2693
8 良い 2571
9 高い 2355
10 楽しい 1895
11 なく 1743
12 楽しく 1619
13 やすい 1573
14 欲しい 1404
15 寒い 1136
16 詳しく 1097
17 早く 1086
18 美しい 1004
19 若い 950
20 良く 900
21 寒く 878
22 嬉しい 840
23 暑い 836
24 無い 820
25 早い 815
26 幅広い 804
27 大きく 779
28 幅広く 768
29 なし 740
30 安く 707
31 いち早く 703
32 長い 700
33 強い 694
34 大きい 661
35 美しく 650
36 よい 640
37 やすく 622
38 ほしい 621
39 安い 616
40 面白い 612
41 新しく 604
42 すごい 603
43 すごく 596
44 っぽい 582
45 悪い 568
46 楽し 566
47 長く 543
48 高く 538
49 にくい 536
50 なかっ 535
51 小さい 522
52 少ない 504
53 優しい 500
54 かっこいい 479
55 近い 472
56 古い 466
57 美し 460
58 美味しい 445
59 白い 444
60 難しい 442
61 軽く 439
62 ぽ 438
63 っぽ 432
64 おいしい 427
65 よかっ 420
66 大き 417
67 うれしい 412
68 可愛く 401
69 涼しく 399
70 多かっ 394
71 暖かい 388
72 良かっ 387
73 やさしい 375
74 少なく 359
75 遅く 357
76 強く 355
77 かわいく 352
78 厳しい 348
79 暑 339
80 忙しい 332
81 っぽく 330
82 熱い 323
83 イイ 316
84 詳しい 312
85 暖かく 307
86 多く 304
87 赤い 297
88 素晴らしい 294
89 く 294
90 カッコイイ 279
91 可愛 278
92 明るい 276
93 広く 275
94 珍しい 266
95 明るく 265
96 黒い 264
97 うまく 260
98 懐かしい 257
99 数多く 256
100 短い 255

「なう」が多い理由は前の記事でも書いた通り、当時のアメブロにはAmebaなうへのリンクが貼られていたため概要に取り込まれていたからです。

「かわいい」またはそれに類似した表現は6位、7位、68位、77位、91位にランクイン。総合してみると6,811件にものぼりました。どれだけアパレル業界でかわいい!が書かれているかとうことですね。

個人的に気になっていた「白い」と「黒い」どっちが多いの問題ですが、白いが59位で444回、黒いが96位で264回という結果に。でも「面白い」の「白い」ももしかしたら混ざってるかもしれません。それを言ったら黒いだって「腹黒い」の「黒い」が…そうそう混じってはいないでしょう。

次は名詞編の合計を出してみたいと思いますので今しばらくお待ちを。本当はワードクラウドとかできたらいいんだけど。これから勉強いたします。

追記:大切なリンクを入れ忘れておりました。このページのおかげでノンプログラマーの私にもワードクラウドを作成することができました。ありがとうございます!

qiita.com

ファッション記事の形態素解析は形容詞の方が面白かった その8

さてさて、ファッション関係のブックマークの概要を解析してみたよ 形容詞編 第8回目です。

では14万件〜約16万件目の100位までの頻出ワードランキングをどうぞ!前の数字は順位、後ろの数字は出現回数となっております。

1 ない 543
2 新しい 510
3 いい 486
4 多い 393
5 可愛い 381
6 かわいい 340
7 高い 289
8 良い 276
9 やすい 218
10 楽しい 179
11 楽しく 177
12 なく 174
13 なう 156
14 寒い 140
15 幅広く 139
16 っぽ 136
17 詳しく 134
18 欲しい 133
19 幅広い 127
20 多く 126
21 寒く 123
22 早く103
23 美しい 101
24 寒 92
25 大きく 91
26 ぽ 85
27 美しく 85
28 いち早く 84
29 若い 82
30 ほしい 82
31 なし 78
32 安く 78
33 やすく 76
34 大きい 74
35 高く 72
36 高 72
37 美し 71
38 良く 71
39 長い 68
40 宜しく 67
41 強い 66
42 新しく 65
43 早い 64
44 長く 64
45 可愛く 63
46 楽し 63
47 安い 63
48 良 62
49 暑い 62
50 無い 61
51 よい 60
52 少ない 59
53 嬉しい 58
54 優しい 57
55 よく 54
56 かっこいい 54
57 暖かい 53
58 軽く 52
59 にくい 51
60 やさしい 51
61 かわいく 50
62 小さい 49
63 美味しい 49
64 なかっ 45
65 すごく 44
66 面白い 44
67 っぽい 44
68 暖かく 44
69 可愛 41
70 正しい 39
71 悪い 38
72 近い 38
73 古い 38
74 白い 38
75 多かっ 37
76 強く 37
77 よかっ 35
78 っぽく 33
79 すごい 33
80 広く 33
81 大き 33
82 遅く 33
83 ダサい 32
84 やわらか 32
85 難しい 31
86 うれしい 31
87 心地よい 31
88 赤い 30
89 忙しい 30
90 明るく 30
91 数多く 29
92 少なく 29
93 黒い 29
94 深い 28
95 珍しい 28
96 うまく 28
97 く 28
98 軽い 27
99 にくく 26
100 熱い 26

…というわけで形容詞編は終了といきたいとことですが、トータルが気になるので出してみることに。

次回、総合ランキングをお楽しみに!