New Fashion Machine +

ファッション専門ブックマーク New Fashion Machine の補足説明です。

ファッションに関するブックマークデータ約16万件をワードクラウドにしてみたよ その5

前回からの続きです。一旦意識が遠のきかけましたがお風呂に入り復活。お風呂は偉大!

f:id:girls_fashion:20180124231733p:plain

データ:57501〜60000件
日付け:b:id:girls_fashion:20090422b:id:girls_fashion:20090514

福岡、広島といった地方の情報がちらほらと。バーチャル地方めぐりいかが?

f:id:girls_fashion:20180124232313p:plain

データ:60001〜62500件
日付け:b:id:girls_fashion:20090514b:id:girls_fashion:20090603

小さくですが自転車という文字が。服の情報を突き詰めているとアイウェアやスポーツウェアにいきあたり、自然と自転車やボード関連のサイトも集まりました。

f:id:girls_fashion:20180124232751p:plain

データ:62501〜65000件
日付け:b:id:girls_fashion:20090603b:id:girls_fashion:20090709

「ファッ」と「ション」の間にある「説明」「入力」ですが、まだブログの概要が書かれてないブログをブックマークした時に入る文字列ですね。

f:id:girls_fashion:20180124233244p:plain

データ:65001〜67500件
日付け:b:id:girls_fashion:20090709b:id:girls_fashion:20090810

メガネの情報もよくブックマークしていました。

f:id:girls_fashion:20180124233525p:plain

データ:67501〜70000件
日付け:b:id:girls_fashion:20090810b:id:girls_fashion:20090914

ここら辺になるとあいつのささやきが聞こえてくるよ…Twitter<Hey!(よーく見てね)

f:id:girls_fashion:20180124234026p:plain

データ:70001〜72500件
日付け:b:id:girls_fashion:20090914b:id:girls_fashion:20090921

Oh…!一気に国際化しました。これはあれです。Fashions Night Out という一年に一度のファッションのお祭り参加ブロガーを検索してみたんですね。素敵な海外ブログがたくさん見つかりましたが、今ではスパムの巣窟になってるかもだから辿るのはお勧めできません。

次々いきたいところですが今日はもういい時間なので寝ます。というかこれ楽しいの本人だけだろう説。

ファッションに関するブックマークデータ約16万件をワードクラウドにしてみたよ その4

続きです。安定してるのかなんなのか、あんまり特徴のないワードクラウドが続きました。できるだけ当時のことを思い出しつつ思い出話でも書いていきたいです。懐かしい連発するかもしれませんがご了承くださいまし。はー、意識が朦朧としてきたので画像だけあげときます。続きはいつになるやら。

f:id:girls_fashion:20180124201639p:plain

データ:45001〜47500件
日付け:b:id:girls_fashion:20081101b:id:girls_fashion:20081126

プーペガールが流行っていた頃らしい。Glamネットワークが出だしたり、雑誌の電子書籍化が進んだ時期だったようです。

f:id:girls_fashion:20180124203724p:plain

データ:47501〜50000件
日付け:b:id:girls_fashion:20081126b:id:girls_fashion:20081226

またちょうど一ヶ月間のデータですね。

f:id:girls_fashion:20180124204816p:plain

データ:50001〜52500件
日付け:b:id:girls_fashion:20081226b:id:girls_fashion:20090221

まだスマホ時代に入るちょっと前、モバゲー、グリー、ミクシィソーシャルゲームでしのぎを削っていた頃みたい。

f:id:girls_fashion:20180124205313p:plain

データ:52501〜55000件
日付け:b:id:girls_fashion:20090221b:id:girls_fashion:20090318

f:id:girls_fashion:20180124205949p:plain

データ:55001〜57500件
日付け:b:id:girls_fashion:20090318b:id:girls_fashion:20090422

で、今更気づいたんですけどこれ160000÷15000で全11回ですね?終わる気がしない!

ファッションに関するブックマークデータ約16万件をワードクラウドにしてみたよ その3

前回からの続きです。

f:id:girls_fashion:20180124191546p:plain

データ:30001〜32500件
日付け:b:id:girls_fashion:20080412b:id:girls_fashion:20080428

とにかくセレクトショップ

f:id:girls_fashion:20180124192518p:plain

データ:32501〜35000件
日付け:b:id:girls_fashion:20080428b:id:girls_fashion:20080519

ただひたすらにセレクトショップを追いかけていたようです。

f:id:girls_fashion:20180124192833p:plain

データ:35001〜37500件
日付け:b:id:girls_fashion:20080519b:id:girls_fashion:20080626

あれ、ハンドメイドが大きいぞ?37500件目はちょうどギャルソンとH&Mがコラボした頃。

f:id:girls_fashion:20180124193238p:plain

データ:37501〜40000件
日付け:b:id:girls_fashion:20080626b:id:girls_fashion:20080918

ファッションブランドのブログを追いかけていたようです。

f:id:girls_fashion:20180124193652p:plain

データ:40001〜42500件
日付け:b:id:girls_fashion:20080918b:id:girls_fashion:20081004

ブランドとセレクトで割れた感。

f:id:girls_fashion:20180124193930p:plain

データ:42501〜45000件
日付け:b:id:girls_fashion:20081004b:id:girls_fashion:20081101

これでもかというぐらいセレクトショップを追いかけていた様子。雑貨もさりげなく大きいですね。

次いきます!

ファッションに関するブックマークデータ約16万件をワードクラウドにしてみたよ その2

シリーズ第2回です。画像が似すぎてて自分でもどれがどれかわからなくなりそうです。

f:id:girls_fashion:20180124173959p:plain

データ:15001〜17500件
日付け:b:id:girls_fashion:20070818b:id:girls_fashion:20070925

よーく見るとYOMIURI ONLINEやみんなの経済新聞ネットワークさんをよくブックマークしていたことがわかります。「ユニ クロ」て。企業名で入ってくるのってユニクロぐらいじゃないかな。私がニュースを意識的に追っかけてたってのもあると思いますが。あとはファッション企業があまり辞書に登録されてないとか?

f:id:girls_fashion:20180124175017p:plain

データ:17501〜20000件
日付け:b:id:girls_fashion:20070925b:id:girls_fashion:20071013

「男性」の文字が大きい気がする。こっちにも「ユニ クロ」ってあります。

f:id:girls_fashion:20180124180015p:plain

データ:20001〜22500件
日付け:b:id:girls_fashion:20071013b:id:girls_fashion:20071107

livedoor Blogに続いてYahoo!ブログの文字も見えます。

f:id:girls_fashion:20180124181128p:plain

データ:22501〜25000件
日付け:b:id:girls_fashion:20071107b:id:girls_fashion:20080128

雑貨とアクセサリーの文字が大きいです。服飾小物に興味があったのかな。

f:id:girls_fashion:20180124181520p:plain

データ:25001〜27500件
日付け:b:id:girls_fashion:20080128b:id:girls_fashion:20080212

Yahoo!ブログに続き楽天ブログの文字が。店長ブログに興味があったのかも。

f:id:girls_fashion:20180124181936p:plain

データ:27501〜30000件
日付け:b:id:girls_fashion:20080212b:id:girls_fashion:20080412

どんだけファッション強調したいのかと。笑 よく見るとパーソナルカラーの文字が。この頃は色彩に興味があったのかな?

次々行きます。

ファッションに関するブックマークデータ約16万件をワードクラウドにしてみたよ その1

こんにちは。一回に5000件も無理があったようで2500件に分けることにしました。今回は全8回に分けて行こうと思います。画像なしより華がある!が、日常系4コマのように同じような画が淡々と続きます。読む方は間違い探しのつもりで読んでください。それではどうぞ!

f:id:girls_fashion:20180124144153p:plain

データ:1〜2500件
日付け:b:id:girls_fashion:20060208b:id:girls_fashion:20060904

今から約12年前。ファッションという字がでかでかと出てますね。いいぞ、それっぽいぞ!mixiが流行ってた時期かな?SNSというタグがちらりと見えますね。

f:id:girls_fashion:20180124145148p:plain

データ:2501〜5000件
日付け:b:id:girls_fashion:20060904b:id:girls_fashion:20070126

バレンタインという字が小さくあるのはバレンタイン商戦を追っかけてた時期があったからでしょう。モテやセレブが全盛期でした。エコ バッグと大きく入ってるのは、この年にエコバッグ騒動という社会現象があったからです。

f:id:girls_fashion:20180124151807p:plain

データ:5001〜7500件
日付け:b:id:girls_fashion:20070126b:id:girls_fashion:20070307

こっちにもバレンタイン入ってますね。今見てもほとんどNotFoundでしょう。

f:id:girls_fashion:20180124152303p:plain

データ:7501〜10000件
日付け:b:id:girls_fashion:20070307b:id:girls_fashion:20070511

教えgoo。笑 ご存知「教えて!goo」をよくブックマークしていたらしい。コトノハは健在だ。phpで個人サービスを作るのが流行り出してたと記憶。

f:id:girls_fashion:20180124153022p:plain

データ:10001〜12500件
日付け:b:id:girls_fashion:20070511b:id:girls_fashion:20070611

ちょうど一ヶ月間のデータみたいです。とにかくセレクトショップのブログをブクマしまくってた様子。ブログサービスとしてはlivedoor Blogが目立ってる。

f:id:girls_fashion:20180124153554p:plain

データ:12501〜15000件
日付け:b:id:girls_fashion:20070611b:id:girls_fashion:20070818

15000件目にちょうどセカンドライフの記事が。時代を感じますね。セレショブームは続くよどこまでも。

駆け足で見て見ましたがいかがだったでしょうか。当時のブックマーカーさんたち元気かな。それでは次回!

ファッションに関するブックマークデータ約16万件をPythonで形態素解析したよ 動詞編

タイトルの通りでございます。前回と同じくデータが大きすぎてワードクラウド作れず。今までで一番地味かもです。ストップワードというやつをうまいこと設定するべきなんでしょうけど知識が及ばず。

それでは頻出ワード1位から100位までをどうぞ!左の数字が順位、右の数字が出現回数となっております。

1 し 156876
2 する 46674
3 い 40438
4 いる 34944
5 れ 30598
6 さ 28219
7 ある 18376
8 なっ 15228
9 なる 12923
10 おり 12691
11 あり 11981
12 き 11078
13 なり 10564
14 ください 10154
15 れる 9172
16 せ 8256
17 いたし 6961
18 見 6830
19 でき 6680
20 み 6672
21 見る 6295
22 てる 6222
23 できる 5974
24 行っ 5925
25 いき 5650
26 下さい 5335
27 思い 5202
28 着 4857
29 られ 4395
30 思っ 4032
31 致し 3920
32 あっ 3685
33 いただき 3630
34 使っ 3331
35 来 3218
36 て 3055
37 作っ 2859
38 送る 2812
39 いう 2729
40 っ 2607
41 書い 2606
42 やっ 2534
43 頂き 2392
44 くれ 2386
45 出 2280
46 持っ 2243
47 思う 2240
48 始め 2227
49 られる 2200
50 いく 2176
51 買っ 2162
52 贈る 2145
53 合わせ 2140
54 しまい 2134
55 いただい 2115
56 入っ 2063
57 行わ 2043
58 感じ 1982
59 考え 1982
60 いっ 1914
61 集め 1884
62 教え 1787
63 みる 1760
64 す 1752
65 しまう 1672
66 出来 1670
67 しまっ 1657
68 くれる 1631
69 ち 1593
70 いえ 1575
71 せる 1563
72 着る 1525
73 頂い 1514
74 持つ 1511
75 受け 1510
76 向け 1498
77 つけ 1488
78 働く 1474
79 答える 1465
80 入れ 1458
81 行く 1444
82 言う 1444
83 作る 1443
84 探し 1431
85 つかっ 1430
86 くる 1405
87 かけ 1386
88 しよ 1379
89 言っ 1361
90 増え 1352
91 知ら 1352
92 言わ 1350
93 行き 1316
94 続け 1306
95 いただけ 1274
96 いただく 1272
97 楽しむ 1271
98 聞い 1225
99 食べ 1213
100 迎え 1211

そこかしこにアパレル店員さんっぽい言い回しが感じられますね。ですが28位、72位で「着」の文字が出なければなんの業界かわからない感じです。

品詞ごとの抽出は終わりにして、元データ5000件ずつからワードクラウドを作ってみようかな?と思います。今のやり方だと5000件ぐらいずつなら画像生成できるようですので。次回からはMeCabを使うので少し新しいワードも入るかも?何回かにまとめてお送りいたします。

ブックマークデータを2万件ずつPythonで形態素解析 名詞編 総合

名詞編のトータルも出してみました。形容詞とは違いデータが大きすぎたのかワードクラウドは出せず…。機会があれば出してみたいと思います。

  • ランキングは主に名詞(名詞じゃないのも混ざってます)
  • 100位までカウントしてみました
  • 記号や数字などのノイズは飛ばしてます
  • 前の数字は順位
  • 後ろの数字は出現回数

以下、約16万件トータルでの名詞抽出結果です。

7 ファッション 94076
8 ブログ 88812
10 店 60140
19 ブランド 38639
20 ショップ 32021
24 の 27901
25 さん 27387
26 こと 26215
28 情報 25316
32 商品 23413
35 紹介 20571
36 人 20031
38 市 19194
39 中 18988
40 セレクト 18152
42 県 16776
43 販売 16039
45 雑貨 15289
46 東京 14752
47 サイト 14638
48 女性 14578
52 よう 13825
54 服 13812
55 日本 13339
57 ♪ 13130
60 円 12529
61 ニュース 12404
64 的 12134
65 イベント 12079
69 デザイン 11678
70 2009 11588
72 アイテム 11378
73 方 11299
74 shop 11040
75 株式会社 11035
76 説明 10902
77 記事 10558
78 入荷 10341
79 モデル 10315
81 人気 10155
82 今日 9930
84 区 9818
85 開催 9758
88 オープン 9577
90 ん 9494
91 発売 9427
92 入力 9357
93 写真 9305
94 日記 9302
97 私 9263
98 アクセサリー 9186
99 プロフィール 9140
100 さ 9120

以上でした。2009年がブックマークのピークみたいですね。いつかなんかの形で盛り返したい。笑