◎正当な理由による書き込みの削除について: 生島英之 とみられる方へ:▲コンピュータ将棋スレッド128 YouTube動画>1本 ->画像>35枚
動画、画像抽出 ||
この掲示板へ
類似スレ
掲示板一覧 人気スレ 動画人気順
このスレへの固定リンク: http://5chb.net/r/bgame/1512031248/ ヒント: 5chスレのurlに http ://xxxx.5chb .net/xxxx のようにb を入れるだけでここでスレ保存、閲覧できます。
>>2 どうせまたQhaperyにまぐれの6勝4敗とかを
大袈裟に言ってるだけだろう
>>2 >>3 ブログ見てきな
302局 219勝 83敗 引き分け9
勝率: 0.7251655629139073
標準誤差: 0.025753242806821414
95% 信頼区間 [0.6754966887417219, 0.7748344370860927]
相対イロレーティング: 168.5464089856178
標準誤差: 22.447496049866377
95% 信頼区間 [127.36163669336156, 214.68277788156257]
yaselmo R4064+168=R4232
実績あるし、まふ、uuunuuunの一派だろ
数年後にはR5000とか行きそうな勢いだな。 どんどん人間と離れたところに向かっている。 いまやR4200越えても全然不思議でない。 どこのブログ?
将棋はゲームとしては中々面白いですね。 エキサイティングです。
数年後から見たら、なんでこんな学習方法で強くなれたんだってレベルかもしれんね
しかし透。さんの記事によればここへきて振飛車復活とか熱い展開だな
透。はニコ生の公式将棋放送ミラーして、放送URL削除されたw
R4232の評価関数は何処でダウンロード出来ますか? URL貼ってくださいな
前スレにあったYapataの対局データはどこ情報?
>>14 公式ミラーっていつからBAN対象になったんやろうな
昔はよかったはず
本当かは分からんけどミラー駄目なのは放送ページに記載されてるから SDT5のページには注意文のってないけどね 本当に削除されてたとしても後から調べて粘着するのってFC2の・・・ まあニコ生運営は昔から番組削除適当すぎるからみんな配信やめちゃったんだよね
そういえばドワンゴは今何かとゴタゴタしてるよね 個人的には叡王戦が無事ならそれでいいんだけど
ニコニコは動画投稿もニコ生も絶賛激減中やからな。 運営に呆れて皆出ていった。
電王トーナメントはなくなり叡王戦は角川主催になります。
ニコニコが潰れたら電王トーナメントはアベマが引き継げばええよ
ライブラリをちょっと改良した勢が大半でオワコン気味だったししゃーない 最後の優勝がちんぽこなのは残念だが
もうライブラリ勢はまとめて1チームのみ出場でいいやん、それか本家に献上して協力者として名を連ねる形で(適当)
>>32 >>31 はただの煽りだろうけど、その改良の難しさ、価値も一般視聴者に伝わらないと興業としてはオワコンというのは間違ってないのでは
無傷の48連勝中だったワカメがとうとう負けちゃった
負けたと言っても相手はウエスタンラリアットだからな まーしゃーない
>>40 確かにこっちも2-3日繋いでるがスペックわからん連中には
ボコボコにされてるわ、CPUくらいのせて欲しいよぉ
上位ってのはR3700後半位のソフトたちなのかな?
たしかに上位ってRいくつ位からを指すんだろう? 3700あれば十分強いとは思うが
EVOKEさんって実際どれくらいの実力あるんだろう? 普通に強そう
24 の最高R 2370くらいです。floodgateの最高Rは2100くらい。 今はコダックがライバルです。 24はソフト指しばかりなんで数年前に撤退しました。 プロに平手で勝った事はあります。 見てくださり、ありがとうございます。
俺もfgで指してみたいわ。スマホからは無理だよね? 一応最高なら2800くらいで今年某全国大会に出た
>>48 うおーすげー、ガチな人だ!
応援しています!!
2800は凄いですね。 スマホはどうなんでしょう。将棋所インストールできないかも。 自分はパソコンから。 floodgate継続参戦したら棋力は向上すると思いますよ。
floodgateの人間指しは棋力よりも精神力が試されれそうw 尊敬するわ
2017年の世界コンピュータ将棋選手権で優勝したソフト「エルモ」と、16年のチェス世界大会で優勝した「ストックフィッシュ」、囲碁の「アルファ碁」と強さを比較した。
強さを示す指標「レーティング」をみると、アルファゼロが将棋では2時間弱、チェスでは4時間、囲碁では8時間学習した時点で各ソフトを上回る実力を手に入れた。
https://www.nikkei.com/article/DGXMZO24325500W7A201C1FF1000/ 連盟「羽生とやるなら7億」 google「フザケナイデ。15億ハライマス。」
AlphaGo派生がelmoボコボコにしたってマジ?
AlphaZero対羽生って案外実現するかもな 個人プログラマにボコられるのには抵抗のあった将棋ファンも、天下のグーグル様に負けるのなら納得できそう
投了値低いのはどうなんだろうな 苦しくなって入玉移行途中で、あのくらい離れることは結構あるから 後ろから詰ますの難しいから粘ってるうちに逆転とかの場合もあるし 1割は負けてるみたいだから、もしそれらプラスしたらもうちょっと下がるかもしれないし まだ色々情報出してくるんかな
実はAlphaZeroがめちゃくちゃ入玉上手いってことはないのか?
入玉弱いって事は、対人で入玉模様になって崩壊みたいな、 一昔前の状態って事じゃね?
NHK放送予定
http://cgi2.nhk.or.jp/goshogi/special/ 激闘!第30期 将棋竜王戦ダイジェスト
12月16日 (土)午後 3:00 〜 4:00
渡辺明 竜王 VS 羽生善治 棋聖
解説:谷川浩司 九段
司会・聞き手:中村桃子 女流初段
第43回将棋の日
12月24日 (日)午前 10:00 〜午後 00:00
司会:山口恵梨子 女流二段、堀伸浩アナウンサー
対局者:久保利明 王将、佐藤天彦 名人
入玉もあれだしディープラーニングは終盤苦手でしょ -900だとそこがごそっと抜ける
>takodori @takodori >Stockfish が考えられないミス、ブランダーを指していると指摘している人が複数。多分、Stockfish の性能が発揮しにくいコンピュータ環境なのではないと推測している人が結構いるね。 ハッシュ1GBしか確保していないのに64スレッドからアクセスしているから、置換表ぶっ壊れてLazy SMPが機能していないとか?
とにかく棋譜を公開してほしいね alphagoが衝撃的だったのは既存の囲碁とは全く違う手を指していたということもあるし
せっかくDEEPMINDが将棋に興味を持ってくれたんだし クソみたいな設定の対局結果だけでお開きになるのはもったいないから伊藤さんみたいに煽るのは正解。 あとPONANZA ZERO待ってます。
論文さらっと読んだけど、「-900で投了だから終盤弱い」というのはデマだね -900センチポーンが10手連続したら投了するのはhead-to-headの対局だけであって、レーティング測定用1秒対局では(おそらく)最後まで指している Figure 1を見る限り、こちらもelmo+400程度のレーティングに収まっているので終盤も問題ないことが分かる
つまり百番勝負の他にレーティング測定用の対局をしてるってこと?
>>69 たぶんそう
そもそもAlphaGoのときもレート測定用短時間対局と長時間100番勝負を分けて計測してたから、AlphaGo論文真面目に読んでた人ならこんな勘違いしないはずだが…
あと、elo測定の方は各イテレーションのAlphaZeroをトーナメントで対局させているから、自己対戦のバイアスがかかって過大なレートになってるというのはあるかもしれない
Elo ratings were computed from evaluation games between different players when given one second per move 1手1分だから強いとかも嘘だね 棋譜生成は Unless otherwise specified, the training and search algorithm and parameters are identical to AlphaGo Zero AlphaGo Zeroと全く同じ学習法使っていて measure false positives, we disable resignation in 10% of self-play games and play until termination. だから10%の対局は確実に終局までやってる
floodgateとかに来ないかな。 棋譜も何も見れないのは残念
>仮にelmoのノード数を10倍にすれば、おそらく互角だったと思います。
>DeepMindにとってはその程度のハードを手に入れるのは容易だったはず
https://twitter.com/uuunuuun1/status/938767261325594625 640コアのクラスタじゃないハードなんかねーよ
8ソケットxeon 28コア =224コアが現状の限界
deepmindにクラスタ化したelmo開発してほしいの?
Elmoとかいう人間の名人に勝ったと称する謎のソフト
学習途中の評価関数をぶっこむ手法使う開発者いるかなあ まあ失敗するだろうけど
elmoはプロ棋士とやってないのにな 情報が間違って伝わってるんだろう
改めて山本は痛いな〜 Twitterのプロフィールの開口一番名人に勝ったアピールが痛すぎる 〜さん?強いよね、の奴も一人だけ滑ってるし自分というもののプログラムは下手なんだな
改めて思ったけどソフト開発者痛い人多すぎだろ・・・
モナコイン、ビットコインを初期から20万くらい持っていればサクッと教師局面作れたのになぁ 今さら言っても仕方ないか
>>74 elmoに10倍時間あげればいいやん。
検証時間が2分の11倍だから双方6セット用意すりゃ良い。
結局結論は、札束でぶん殴るゲームだったわけで、 残念感があるのは拭えないところでしょ。 elmoと対局させた際、elmoにはどの程度のNPSを出せる環境を用意したのだろう。
ソフト開発者がそのスペックずるい市販PCでやれよと負け惜しみ言ってるのが プロ棋士がソフト開発者にあれこれ言って制限つけさせたのと同じで悲しい しかも英語を読めないからルールを勝手に勘違いして 不正だ不正!ってデマまき散らしてたとか・・・これが本当なら恥ずかしすぎるわ
>>74 そもそもLazy SMPでは128,256…とスレッドを増やしていっても殆ど棋力上がらないのでは…
SF8の実験でもリニアにスケールするのは16スレッドまでだったような
頭打ちのelmo vs まだまだスケールする余地のあるAlphaZeroと考えるなら、むしろAlphaZeroのほうが不利な対局条件ともいえそう
>>85 それな
プロ棋士を蔑む発言してたのに
いざ自分が似たような立場になった時の身代わりの早さ
ハードが飛躍的に進歩したから出来た事も忘れてる
そもそも公平な対局なんて無理なんだししゃあない reviewerもいないし内容もスカスカだから、突っ込まれる余地がある作りになっている。 科学誌から突っぱねられたからarxivに公開したみたいだけど
>>85 >>88
つまり電王戦でスペック制限を強制したドワンゴと将棋連盟、それに諸手を挙げて大賛成したプロ厨は人間のクズってことだな
>>70 >elo測定の方は各イテレーションのAlphaZeroをトーナメントで対局
あー、そういうことなのか。
その各イテレーションごとの対局結果に最後にelmoと特定のバージョンとの
対局結果入れれば、elmoを基準にした各イテレーションごとのレートが出ると。
技巧2と二枚落ちでやってみたが・・・ クソ強えーよ こっちが相手にしない指し方をしても、歩・銀・桂の使い方が絶妙すぎ! 本気のプロでもあそこまで鬼のように指せるかどうか
>>88 というかプロがスペック制限云々やってたレベルとは違う
対戦前準備数百年あるレベル
普通車とF1車で普通車が勝てることがあるならそれは凄いと思うがね ハードもりもりも良いけど統一で技術のみ競うのも見たいよ 同じ土俵に近づけないとハード凄いからって印象になっちゃうし ハード凄くても駄目だった誰かさんよりましだけど
>>94 そもそも公平性はなんぞ?ってことなんだが
都合の良い時だけ当てはめた発言はどうなのって言ってるんだけどな
>>94 根本的な中身で言ってる事は同じ。
だから見せかけの公平性の話に戻ってくる。
いちゃもんつけてる理由が違うんじゃないかな。 自分が有利な条件で戦いたいと言ってる開発者はいないだろ? そんな条件じゃ強さの証明とはいえんから俺と戦えといってるように思えるけど。
実際煽ってfloodgateあたりに来てらって どんな将棋を指すのか見たいでしょ。 せっかく序盤鬼強いのに棋譜もないのは残念だし
汎用相手に専用で勝った負けた騒ぐのってどうなんだ? もし負けても alpha zero「新手の将棋ソフトには勝てないみたいなんで、これからは桂馬は横に跳ねるルールにします」 ってされるぞw
スペック制限云々でいうと、どっちかといえばDeepMindのHash1GBとかの勝手な(しかも無理のある)条件設定での勝利宣言が将棋連盟的に見える
>>96 まどっちにしてもプロと対戦した時のパソコンはヨドバシでも買える代物で
プロどもはそれを制限しろと泣き喚いてたわけだが
グーグルさんのはとても素人に同行できるレベルじゃないからな
ロボット徒競走を行います。但し秒速20mまでと制限します。 みたいな、そこ縛ったら何で勝負するのですか、みたいな台無しレギュレーションってあるものなの?
平岡さんがまたアレを始めてくれそうだな 協力し甲斐がある
ハッシュについては前にやねが「少なくても影響ない」とか言ってたのは なんだったんだろう。
Daisuke Okanohara @nips2017? @hillbig
In Silver's talk about AlphaGoZero for Chess and Shogi.
Although alpha-beta algorithm is now widely used, MCTS based search outperformed.
He thinks this is because alpha-beta is severely affected by NN's approximation errors
but MCTS is not because it uses average. #NIPS2017
https://twitter.com/hillbig/status/938904942500122625 Daisuke Okanohara @nips2017? @hillbig SilverによるAlphaGo Zeroの講演の中で、将棋とチェスに適用した際、 alpha-betaを使わずに、MCTSを使い、それが強かった理由とし、 NNはたまにひどい近似誤差があるので、alpha-betaのmax-min計算は強く影響うけてしまうが、 MCTSは平均を使うので近似誤差が打ち消されるとのこと #NIPS2017
今はまだ計算リソースを動かすハードもかなりのものが必要だが 学習や動かすのに1080レベルでも出来るようになればαβは不要になるね。まさに革命 今はリーマンの将棋開発者だと破産しちゃうから、現状のライブラリを使うけど
αβは不要じゃなくて使えないから仕方なくMCTS使ってるんじゃないの
TCEC Season11 ディビジョン分け。国籍が多彩なのがいいところだな。 プレミアリーグ 1.Houdini(ベルギー) 2.Komodo(アメリカ) 3.Stockfish(ノルウェー) 4.Fire(アメリカ) 5.Chiron(イタリア) 6.Ginkgo(ドイツ) 7.第1回1部1位 8.第1回1部2位 1部リーグ 1.Andscacs(アンドラ) 2.Booot(ウクライナ) 3.Gull(ロシア) 4.Fizbo(アメリカ) 5.Hannibal(米/フィリピン) 6.Nirvana(米) 7.第1回2部1位 8.第1回2部2位 2部リーグ 1.Jonny(ドイツ) 2.Bobcat(オランダ) 3.Texel(スウェーデン) 4.Vajolet2(イタリア) 5.Wasp(アメリカ) 6.Arasan(アメリカ) 7.第1回3部1位 8.第1回3部2位
alphazeroを動かすのに大量のTPUを使っていたみたいだけどそれは読みを深くするためなの? 普通のPCで動かしたときとどれくらいレーティングが変わるのかな?
今回のDLはプログラムから自動生成する人間の上位互換という話を聞いたよ。
ルールしか与えて無いからね。 囲碁でもチェスでも将棋でも使える最強プログラム。 特化しておいて負けているのは流石にマズイでしょう。
AlphaZeroは短期的には損するが長期的に得になる戦略的な手が得意
Mariya?認証済みアカウント @thinkmariya
Alpha Zero doesn’t play like humans OR like computer engines.
Optimizes for long-term positional sacrifices, when historically sacrifices are done tactically
@demishassabis #NIPS2017 #NIPS #AI #ML #chess #games
>>105 数年前のノウハウが役立たずになることはよくある
特化型を莫大な計算資源が無くても開発できるソフトと解すれば昔のノートPCで優勝した bonanzaに通じるものを感じる
>>105 よくわかんないけどuuunuuunさんとこでも再現しないみたいだね
いつものように44cの環境で4tのやねうら王を複数立ち上げて並列対局させて検証していたなら、メモリアクセス周りがふつうの条件と異なるので不思議な結果がでてた可能性もありそう
>>118 普通の個人が開発すると100年かかるとか説があったような、、あるいは数千万か数億円か
>>116 人間の様でもないコンピュータの様でもない、か
素晴らしいね
まさしく人工知能だ
人らしい知能なら人を使えばいい機械である必要なんてない
>>116 今まで、駄目とされていた定跡が復活してくる可能性もあるな
棋譜が見てみたいものだ
これで棋譜もなし、floodgateにも来ないってなると悲しすぎるな。 個人が再現すんのにどんだけ時間と金がかかるやら
Googleの計算機資源の意味を逆さまに考えてるやつが多いね 安価ながらくたを積み上げて膨大な計算機資源を生み出す これがGoogleの最大の強み 高価・高性能のスパコンのような集中型とは対極の分散型 他の企業あるいは個人に比べても圧倒的なコストパフォーマンスで 計算機資源を使えるからこそそれを有効に活用するソフトウェアをほしがる ハサビスのAIもその一つだ 例えて言えば、家に転がってるもう使わない古いゲーム機とPC何台かを使って 最新の重い3Dゲームが遊べる、みたいな曲芸を連中はやってるんだよ
振り飛車復活フラグが立ってしまったか。 ただ1080Tiで動かしても弱いんだっけ
事前の学習に資源いるだけで動かすのは軽いので充分だろ
囲碁では有志のマシンを募集してalphagoと同じ仕組みで強くしていくソフトがあったけどあと15年でR5000いくとか 将棋で同じことしたらelmoに5年くらいで届くかな
1080tiだとelmo越えは無理 人類より強いかどうかも微妙
dlshogiがfloodgateレート2800だったから、人類は超えてるんでない?
sdtのスペックだとAlphaZeroは弱いんじゃないかという説もあって、どうなんだろうと思った。 そのあたりも調べられているんだろうか
>>131 今のfloodgateのレートだと人間のTOPクラスで2800前後とおもってます。
100局程度指したと仮定して(2wレートでないほう)
ちょうどGPSに互角なら2800ですね。
豊島さんなら勝ち越しそうな気がするが。
suimonに関する話題はスレ違いなのでこちらでお願いします。
mztn7まふsuimonこいなぎ応援スレッド
http://2chb.net/r/bgame/1512573528/ >>80 >自分というもののプログラムは下手
笑ったw
>>85 やねうら王をGPU、TPU使って高速化すれば良いだけだよな
化石技術は最新ハードの恩恵受けられないとかじゃないよね?
マイニングにCPU使ってるバカなんていないでしょ?
AIが人より上手くAI作ったとか最近記事みたしこのまま進化続けて欲しいね 地球や動物は好きだけど、人は色々やり過ぎてるからねAIに適切に管理されるべきである それはさて置き、ビクーニャ可愛いよビクーニャ!
NVIDIA,Volta世代初のグラフィックスカード「TITAN V」を発表。ディープラーニング向け
http://www.4gamer.net/games/208/G020859/20171208030/ 理論演算性能値は110 TFLOPSに達するという。
みんなNIPSに合わせてるのね
>>141 Volta世代で一般庶民にもギリギリ手の届く製品が出たのね
>>141 これ使ったらfloodgateにいるdl勢はどれくらいのレートが期待出来るの?
>AlphaGo Zeroが72時間で人間超えてやべーってなってますけど、真にやべーのはこの学習を3日で終わらせるGoogleのマシンパワーですから。 >私のPC(GTX 1080 x2)だと、同じ学習を完了するのに62年程度かかります。Master超えバージョンなら735年です。 >5000TPUを12時間投入してelmo+400。 >GTX1080Tiなら110年くらい学習すれば実現できますね。
学習さえ終わればそんなにスペックいらないし それ言い出したら AWSじゃぶじゃぶ使ってるやねうら王も 他の開発者からしたらやってる事は変わらん
ドワンゴ「スペック無制限は不公平!!」 開発者「(学習)スペック無制限は不公平!!」 日本人っすなw
>>144 その数字は全然根拠が示されていない
真偽の怪しい数字を引用しないように
そんなにスペックいらないって毎回言ってるやついるけどそんなにってどの程度で言ってるん? 学習ほどじゃ無いにしても4分の1位の尋常じゃないハイスペックがいるんじゃないの?
>>144 その数字おかしいと思うんだよな
その計算の通りだと第一世代TPUが1080tiより32倍の性能がないとおかしいけど、第二世代TPUでさえ4チップで180TFLOPSでしかない
1080tiは11TFLOPSくらいだからね
現実的な費用と時間でできるなら再現すればいいだけでは そいつを元に3駒の評価値作るのも良いし
平岡さんは100億作るのをAWS費用を募るのかな? それともAWS立ててくじらちゃん方式?で有志のPCリソース借りるのか? 後者ならAWS借りる必要あるんだろうか
4TPUは専用ハードというだけで 消費電力で言ったら160Wでしかない
>>148 学習にそんなに時間かからないとか
1080TiでもR elmo -400より強いって言うにはいいけど証拠を示してほしいよね。
>>141 110TFLOPSってすごいな
電気代とかも考えたらこれがしばらく必須になるんかな
>>141 初代地球シミュレータが35TFLOPSやん。
バージョンアップ後に122TFLOPS。
もちろんスパコンはデータ転送量が圧倒的なんで単純比較はできないが。
羨ましいいってるだけで不公平とまでは言ってなくね?
これに関してはしばらく静観だな。 棋譜が見れないと何とも言えない。
>>141 TDP300Wって、コンロかストーブやんけ。
空冷で連続稼働できるんか?
>>118 bonanzaも当初は学習させるところは、当時としてはかなりの電力と時間をかけたんだよ。
勘違いするな
>>132 SDTも企画側が勝手に設定したものでそこを基軸に考えると議論が濁る
>>136 実行においてはDL使わないでしょ
誰もがメインストリーム向けの1GPUで動かしたときの棋力は興味ある話題でしょ TPUは謎が多いから分からないけどどのくらいの強さかは気になる。
まあそんな驚愕するような序盤はないと思うけどあってほしいという願望はある
leela zeroプロジェクトの将棋版とかあったら面白そう。 私のパソコンだと数百年かかるので皆さん協力しませんか?って
将棋プログラマーは当然"対等に"戦うことを求めるけどここは将棋ソフト最強なんて興味ないだろうなあ 進展が見込めないと言われていた汎用性のある人工知能で専用の人工知能に匹敵するというだけで十分価値があるし むしろここはもっと先のスタークラフト2みたいなRTSに力入れるだろうから 意外にあっさり将棋ソフト最強の座は譲ってくれるかもね
>>168 平岡さんがまた元気玉やりそうだから、それでいいんでね?
ほとんどがDLに懐疑的だったくせに 結果を出されたら自分達がソフトを強くできないのは ハードが足りないからと言い訳ばかりだしな、言ってる事が正しかろうが ダサいのは間違いない
DLに懐疑的だったのは結果的に正しかったのでは? 囲碁との比較的に
>>171 DL懐疑的ってのは終盤強くないからって事でしょ
詰み有無なんかはとにかく数読ました方が早いし
ダサいのはそうだけど、本業の片手間の開発にそこまでモチベーション期待するのも酷だなぁという気もする ponanzaは擁護できん
コンピュータチェスの専用掲示板 AlphaZero beats AlphaGo Zero, Stockfish, and Elmo
http://talkchess.com/forum/viewtopic.php?start=0& ;t=65911&topic_view=flat
Historic Milestone: AlphaZero
http://talkchess.com/forum/viewtopic.php?start=0& ;t=65910&topic_view=flat
Alpha Zero vs Stockfish 8 tournament conditions.
http://talkchess.com/forum/viewtopic.php?start=0& ;t=65920&topic_view=flat
そのうちfull paperで詳細がわかるだろうけど まずはどうぶつ将棋か55将棋で実装したいね
オセロはどうなんやろ 試したけど最強ソフトを超えられなかったからスルーしたのかね
>>171 同等のリソースあったら三駒に注ぎ込んだほうが強くなるでしょ
>>171 典型的、あまりに典型的な
「負け犬の遠吠え」
になるよね。
>>171 実際物量勝負でしょ。
あと論文はreviewを通してないものだし突っ込みどころが満載なのは事実
>>169 将棋をこれ以上強くするかはわからないが
それ以外の論文ですぐに原始人を黙らせるだろう
The company has already begun using AlphaZero to
study protein folding and has promised
it will soon publish new findings.
蛋白の立体構造か 最先端の話題だな 製薬とかで巨額が動く
>>179 オセロは専用ソフトは中盤から読み切りモードになってミスが完全になくなるから
中盤から他のソフトに切り替えるとかやらないと多分勝てない
つーか途中で打ち切ってたとしても終盤弱いわけ無いだろ・・
>>177 むしろPfNはチェス作ってTCECに殴り込んだほうがいいかも
終盤の強さこそ皆が知りたいのに、クソみたいな雑な論文だからチェス界から皆から突っ込まれることに これはリジェクト あと久しぶりにYAPATA_Lが来たね
結局PFNって何だったん? R2000くらいのソフト作ってドヤッてたけど
>クソみたいな雑な論文 今回の件でいちばん顕示したいのは糞みたいに雑に片付けちゃいましたぁというところだから 皆があんたのように思えば思うほどやつの思うつぼw
結局探索部分を人間が書いていることこそが
強さのボトルネックなんだろうな。
@issei_y 6月2日
せやな
これと同じ事が起きた
ディープラーニングがマシンスペック勝負なのは事実では?
>>180 今回の論文読みました? いちばん顕示したいのはalphazeroの汎用性ですね
その汎用性のアピールに囲碁より簡単なチェスや将棋が妥当かは疑問ですが・・・
実際科学誌からは突っぱねられたみたいです
汎用性ならマリオカートとかスプラトゥーンでやって欲しい。 まあプロトコル公開されてないから無理か。 任天堂と守秘義務契約…グーグル相手じゃ無理か。
AIの汎用性というか性能を一番比較できるのはRTAだろう あれ以上に運と精度を求められるものはない
>>195 将棋と囲碁で受けが悪かったので次は一般人がより身近に感じられるような応用例が見られるかと。
あと山口さんの言う通りやっぱり1080Tiでelmo +400に到達するのには100年くらいかかりそうです。
>>194 いややつが明示的に言っていることだからそりゃそうなんだよ
>>192 が出してる写真をしばらく眺めてみそw
>>193 >実際科学誌からは突っぱねられた
これ信頼できるソースあるの?
1080Tiが倍精度や半精度が極端に遅いのはわかっていること DLに使いたければそれなりのものを買え<NVIDIA
金がかかっているのだからセールストーク的な部分があるのはしかたがない 一般人の使用するPCでまかなえる物量で どの程度の強さになるのかぐらいは知りたい
伊藤氏がgoogle に対し 「フラッドゲートに出て来い」 と凄んでますが。。
>>199 明確なソースはないです
Natureとか商業紙って査読中の論文の公開を禁止してませんでしたっけ? こういう形での論文の公開だから蹴られたと解釈した
今は事情が変わってたらゴメン
AlphaGoの時にも同じ事を言ってたら一貫性あったのに いざ自分達の主戦場が荒らされたらTPUガーで逃げるの本当ダサい
>>202 まったくとんちんかんなことを言ってるなあ
老人性痴呆症かも
>>203 恥ずかしい奴だなお前
日本の開発者ってこんなんばっかりで嫌になるわ
ツイッターではAlphaZeroの開発者を無礼に煽ってるのばっかりだし
>>197 これ見て何時も思うけどハードの進捗は将棋、囲碁の開発者の貢献はないよね
時代の進捗は別のプログラマが担ってるのにハード面で云々は何も思わないのか
今の現状はいろんな巨人の上でおこなわれているのに
公平だ不公平だはあまりにも・・・・
>>203 明確なソースはなくても人の名誉を傷つける自由はあるってか
昔の理系の本の巻末には指数対数表とかよくあったんだよ 自力で計算するのがたいへんだったから アルファの局面先読みは既存のソフトに比べてはるかに少ない 時間がかかったのはその前提となる「思考」を作る局面
3駒か4駒かと議論しているうちに全駒が出たんだな NPSは低いが全駒を精密に評価すればかなり高い精度で局面が評価できる
>>208 >>192 の写真を見れば明らかなように
他人をおちょくってるんだから怒るやつがいても仕方がないとは思うよ
やつの術中にはまってるとも言えるけどw
分野によっては新しい知見は速報系の雑誌に出しから査読誌に詳細出すんじゃないはてな?
一手あたりのノード数とレートの関係ってどのくらいのもんなんだろ
>>214 すまん書き方が悪かった、通常のアルファベータ探索のほう
ノード数とレートのコスパ(?)だったらまだ人間が圧倒的だな 人間>>>>alphazero>>>>技巧>aperyなど ってな感じだと思う
>>215 elmoとAlphaZeroとの比較グラフがあるよ
ソフトからすると人間の脳構造はずるいと思うだろうよ
>>218 fig.2のグラフのこと? npsってどこらへんに書いてある?
>>220 ノード数とはちょっと違うけど、
技巧なら深さとレートの表あったはず
技巧は確か深さ上げてもレート上昇緩やかなんだっけ?
>>220 nps = 1秒間に評価したノード数 ≒ ノードの評価速度なんだから
そのグラフで問題ないだろ
で、googleさんはフラッドゲートに来てくれるのかなあ。
まあ十分参考になるんだけどさ、横軸が時間だからどのくらいノードが出てるかイマイチわかりづらいのよ
この集団でこれほど画期的な内容でリジェクト喰らうなんてマヌケやらかすとは思えないから、しばらく待ってれば査読付きのフルペーパーと質、量共にこっちが見る気失うくらいの棋譜とセットで投下してくれるに一票かな
おとなしくフルペーパーを待つか、フリーで公開されるといいけど
「実際科学誌に突っぱねられたみたい」←妄想 「終盤弱いはずだ」←今までの常識による思い込み 「TPUがセコい」←無意味な議論 「同条件ではelmoより弱い」←無意味(ry 「入玉拒否」←虚偽 「コスパが悪い」←頭が悪い 「110年ガー、同じ時間アレバー」←現実逃避 「DLの限界を示しただけ」←決定的に視野が狭い じゃぱにーずちぇす界隈の民度酷すぎません?
将棋界隈の民度が低いってここ数年でアホほど分かったことを何をいまさら言ってるんだ?
民度とかなんとかは知らんが、まぁ物事を疑ってみるのも重要なことよ 権力者が言ったことを全て信じていれば良いなんてことはない
DeepMind社が示したいことはDLの有用性だけど、こっちが気にするのは将棋AIとしての強さだから食い違いもおこるさ
>>195 DeepMindはブロック崩し、パックマン等のゲームをDeepLearningで攻略して名を売った会社だよ。
シルバー氏は現実の世界が碁のようであると言うのを躊躇すると言います しかし、より良いアルゴリズムを作るための鍵は、 問題やドメインに特化したコンポーネントを 削除することだと彼は考えています。
不公平とかせこい言ってるとかいうのは深読みしすぎじゃないか?
とりあえず終盤も強いはずだ弱いはずだ言っても今の段階じゃどっちも憶測の域を出ないわけで 3駒関係のほうが効率がいい悪いも同様で、 スペック制限されたうえでの強さというのもコンシューマー向けには意味があるわけだし 最後はハードの進歩で案外簡単にgoogleスペックが家庭まで普及しちゃうかもだけど
もし、将棋ソフト開発者が強いシャンチーとチャトランガAIを1000万で開発しろと依頼されたら、どうするだろう 将棋ソフトの技術は大して使えないんじゃないか、シャンチーとチャトランガの勉強するのか
>>234 もハードが十分進歩したから言えることで、今までは余裕が無くて何かに特化することで
妥協していたことを妥協しなくてもいいようになったってことだと思う。
スレ違いすまん
ニートが自分がやってるボードゲームでで唯一色々言える日が開発者たちが負けた時だけだからそれまで毎日妬みに妬みぬいた感情をぶつけてるんだよ だからその根本である結果が揺らぐようなレスは絶対に許せないのでひたすら粘着して荒らす 囲碁の日常が将棋とチェスに着ただけ
まずはチェスの3強を倒すつもりなのかな プレミアリーグの1番下から殴りこみにきたら面白いのに
公平言い出すなら elmo側の探索もMCTSにしたらどうかって話なんすよ 多分レート1000くらい落ちるんじゃないかな
盲目的にDMに研究不正などあり得ない!異論はすべていちゃもん!っていってるのすごい既視感あってなにににてるのかと思ったら、 小保方の疑惑のではじめの時に理研の権威を盲信してた人たちだわ
uuunさんがStockfishは定跡使ってないのにAlphaZeroは定跡使ってたって書いてるけど、どこソースだろう デミスは使ってないってつぶやいてる
Opening Bookの意味が分かってないんだろうな AlphaZeroは独自の定跡を編み出したという言葉を勘違いしてるんだろう
このスレで評価関数は事前カンニングとか言ってる奴と同じ主張にみえる
ハサビスは信じず怪しい英語のメールを信じるんかwワロエナイ 指摘された入玉の間違いも修正しないしダメだコイツ
AlphaZero has not only learned how to play chess, at the same time it has also learned the best openings (like humans do). This knowledge is stored in the neural net file from A0. こんなメールを貰ったので。 @uuunuuun1 論文 Each of these openings is independently discovered and played frequently by AlphaZero during self-play training. 普通に評価関数が良いopeningを見つけただけだが 気に食わないらしい これが嫌なら、将棋ソフトも評価関数禁止だな 墓穴掘り過ぎじゃないか
今当たり前のように使われてる定跡ファイルを作っておく方式こそ、事前カンニングみたいだと思うけどな マシンパワーに任せてdepth40のMultiPV5とかで大量に事前に読んでおいたらそりゃある程度レートあがるにきまってるよね
百歩譲ってアルファがオープニングブックを使っていると見做せるとしても それならStockfish側も使っていることになるだろw
>>229 将棋そふとぷろぐらま〜(笑)のツイッター見てるとほんとこれって感じ、笑うわ
しかも市販PCでやれよ?公開対局しろよ?ん?びびってんの???ってツイッターで煽ってる人ばっかりだし
民度やばすぎぃ
>>256 その通り、既存の将棋ソフトのレベルは低かった
そして低レベルの将棋ソフトにスペック制限や事前貸し出しハンデを与えても負けまくったのがトップ棋士たちだ
現状棋譜も出さずにelmoに勝った言ってるだけなんだから 表出てきて見せてくれというのは普通の事 こんなことで民度が低いとかどんなぬるい世界で生きてきたのか
論文の内容で疑問点や突っ込みどころがあることなんてむしろ普通なんだが そういうのに誰も突っ込まなくなったらまずいでしょうよ
俺は考えたんだがな、囲碁のときはMasterとしてネット碁でテストしてたわけだが、 それを将棋やチェスでやってないってのは不自然なんじゃないかと。 そう考えればたぶんもうfloodgateでテストしたんじゃないだろうか。 最近現れた強いソフトで、どのソフトだったのかいまだに謎なのがいくつかあるだろ? その中のひとつがAlphaZeroなんじゃないか?
たとえば即指ししてくるいかにもNN使ってるっぽいNG-N100のシリーズは、 結局SDT5組の誰でもなかったし、AlphaZeroのプロトタイプだったかもしれないよね。
まあないだろうな、ランキング上位にそれっぽいやつはいない しかも仮にテストしててもそれほど最近じゃないと思うぞ
まさか将棋ソフト関係者でボナンザメソッド、機械学習を否定する奴がいるとは あんなのが将棋ソフトのレーティング作ってたのか、レーティングの信憑性も怪しいね
>>258 フルペーパーくるぞ
Announcing #AlphaZero - our general RL system that starts from random and learns thru self-play to beat the top chess, shogi & go programs!
Preliminary arxiv paper: arxiv.org/pdf/1712.01815… Games here: goo.gl/UEHcWz
More details in full peer-reviewed paper coming soon.
このスレの奴らってすごいな 散々uuunのサイト参考にしたりなんだりしてるのに、少し的はずれな意見言っただけでクズ呼ばわりとは
発言がクズなのとサイトの便利さは無関係だからな。 だいたい日本人はおかしいんだよ。 能力があるやつは人格者でなきゃいけない的なことを思ってるやつが多い。 でも、大抵能力が高いやつほど人格的にはクズ。そういうもんだ。 なので、クズよばわりするけどもサイトは便利に使うことは何も問題はない。
人格もクズでブログの内容もクズの知ったかぶり雑魚ブロガーはどうしようもないんだよな
日本人「金と計算資源あれば俺でもできるわ」 天才「ふーん。なんでお金と計算資源ないの?」 日本人「ぬぬぬ!入玉!入玉!」 こういうことでいいですか。
チェスはよく知らないけどこれは今対局中なのか
https://chess24.com/en/watch/live-tournaments/alphazero-vs-stockfish/ floodgateに来てほしいけど英語ページあったっけ
英語版の将棋所を使えば難しくはないけど
>>273 だからそれは論文に書いてある棋譜だろ。論文見ろ
ライブってかいてあるのに釣られるなって
日本勢はPonanza Chainerを通して 物量があっても宝の持ち腐れだと証明しちゃったから 一切言い訳出来ないよね(´・ω・`)
>>270 君はなんて素晴らしい人格者なんだろう!
>>277 失礼ながら、棋譜解説の部分以外は内容薄過ぎない?
>>279 いやしっかり書いてるじゃないか
alphazeroは凄くない、deepmindも凄くない、凄いのは人間の経験とチェスだ
言いたいことが凝縮されてるぞ
>>277 > one of the original Stockfish authors, Tord Romstad,
そういやこのひとってUniversal Shogi Interface (USI) を作った人だった
平岡スタイルで生活していける女性は結局現れなかったのか… 🙍🙍🙍🙍🙍
強いソフトの棋譜を見たいと思うのは普通じゃん。 純粋に興味がある。 別に、「elmoより強いのを証明しろよ!」 とかそういう訳でもない。
棋譜がみたい。あわよくばfloodagateに来て欲しい。これだよね。 どうせソフトは公開されることはないし個人でalphazeroの再現も難しい
だからfloodgateは1敗が付くまでは延々と下位と当たる仕様だから 仮に来てもツマラナイ事になるよ
alphazeroの話題で盛り上がっているなか、ひっそりと消えるGPSfishのホームページ
同じソフト同士をとある局面から ・60秒で思考させた場合の評価値 ・1手10秒で6手指させた先の評価値 だったらどっちが信頼度高い?
>>294 手広い局面なら前者
一直線の変化なら後者
実際に例の100億局面ファイルの評価値を スクリプトで6手ズラして学習すれば分かるよ
Bonanzaメソッドから12年、 ようやくブレイクスルー来たか。
civとかstellalisのAI作ってほしいなぁ
[Shogi-server/Floodgateのお知らせ] 停電のため、12月9日〜11日夜にかけて、停止予定です。
http://wdoor.c.u-tokyo.ac.jp/shogi/ ある局面の正確な評価を出したければ その局面からの定跡を生成するのが一番だと思うけど やり方はわからん 誰か教えて
>>301 makebook think コマンドで指定局面までの定跡を読み込ませて
そこの手数をstartmovesに指定すればいいんじゃないか
形成判断だけで言えば評価値よりもその局面からの勝率の方が正確だと思うんだよね
膨大な計算資源で俺TUEEEしてたポナンザが引退して間もなく、今度はGoogleが俺TUEEEで退屈しないでござるな
ハサビスさんは、日本向けのビッグなプレゼントを用意しているでしょうね。
ああ、どデカいクリスマスプレゼントが届きそうだ そういえばここにもDMが小保方だとかみたいなことを決め付けてた奴もいるが、非難を通り越して微笑ましく思えるときがくるんだろうなあ 楽しみ
masterでネット碁を賑わしたのってちょうど去年の暮れから年明けにかけてか 今年は日本向けに将棋で何かやってくれるのか?
DLで詰将棋ルーチン開発して結果的にDLでも詰将棋効率よくばんばん解けるよってなるんかな これから単純に特化型AIが消滅するんじゃなくて、汎用AIに吸収されるのかなとか思った
>>310 そう、その通りだと思うよ
特化型は汎用型とは全く別と見なしがちだけど"思考"特化型にすれば汎用型になれる
multicsからUNIXへの流れと似てて面白い
汎用AIが将棋も出来る、という時点で 凄いと考えるべきかと 実際にどれだけ出来るかは別として
汎用AI搭載のスマホが囲碁将棋チェスを教えてくれる時代はすぐそこか 専用エンジン必要なしの時代に
さらに汎用を吸収する汎汎用、汎汎用を吸収する汎汎汎用 これもうわかんねえな
???「Hey,Siri! ブログ書くからこの局面の評価を教えて」 Siri「土井矢倉は終わりました」 こういう時代到来という認識でいいですか
小嶋のブログを読んで、この前の羽生の指し回しを思い出したんだが、今回のことで一番得するのはもしかしてプロ棋界なのかもな。 ・理系将棋と文系将棋が「別分野」であるという明確な線引きがなされることで、芸能的な意味合いが強くなる可能性 ・今までの論理的思考の積み上げの内、正しいものが日の目を浴びるようになる可能性 ・序盤革命(藤井システム級の存在含め)が起こることで、指す将の幅が広がる可能性 ・将棋のゲーム性について深い理解が及び解説や説明等が専門的な用語を使わずとも行えるようになることで、観る将の規模が広がる可能性
😁😁😁
将棋クエスト棋譜【2分】 (melonsky[2145] 対 garnet_crow[2383])
http://wars.fm/shogi2/game/t6ryclxxsc59 #将棋クエスト #ShogiQuest
Alpha先生、恐らく「なんじゃこりゃ!?」って指し回しだと思うわ。 ゼロからでしょ?
将棋の神は後手になったら初手投了だろ? 俺でも5割勝てるな
>>322 でもお前が3手ほど指したら後手必勝になる。
チェスでは、後手になったら引き分けが精一杯ということだから、とりあえず千日手を目指すのではないかい? 参考:AlphaZero vs ストックフィッシュの戦績(チェス) 先手Alpha 25勝0敗25分け 後手Alpha 3勝0敗47分け
>>323 初手の最善手26歩で投了するから3手って意味不明
低脳の低棋力が書き込むとボロが出るな
別に将棋の神の基準に負けを悟ったら投了なんてのはないぞ。 むしろ本当の最善手を考えるならば、相手のミスも織り込んで完全に詰まされ切るまで指し続けるだろう。
今までの経験で「将棋の神」という文字が入ってるレスは、例外なく幼稚で役に立たないレスだと分かってきた
>>331 いずれ、将棋も似たような結果になるのだろう
チェスでは人間が対戦すると先手、後手の差異はあまり無いらしい
>>332 いやチェスは将棋よりも圧倒的先手ゲーム
将棋は駒の動きが分かりづらい。漢字から伝わるニュアンスが「狭苦しい」「ダサい」。手数をかけなくてはまともに駒が進まない。持ち駒のせいで終盤が異常に忙しい。 終盤のせいで中盤をあまり勉強しなくてもよい。序盤が定跡ばっかりで堅苦しい。日本人の嫌なところを詰め合わせたようなダサさだな。 社畜を生む原因はここにもあったかw合理的な人間ほど将棋では駄目になる。心の強さこそが重要。it`s a pity game!HAHAHAHAHA
やねうら王のおかげでstockfishに興味持ってチェスも始めたけど将棋よりカジュアルに楽しむ環境が揃ってるんだよな 将棋は棋士に魅力もないし、対戦サイトはダサいしソフトはアホみたいに容量食うし、楽しむのは大変だなと思った
いろいろ気なるところがあるものの、今の段階じゃ推測しかできない いろんな棋譜がみたいしもっといろんなソフトと戦ってほしい しかしAlphaZeroが現れるのにふさわしい場所ってfloodgateしかないのかしらん 囲碁界には野孤やらなんやらあるけど
某雑魚ブロガーみたいにアフィのためとか、リアルで人との交流がないからtwitterに依存しているとかなければコンピュータ将棋やめてコンピュータチェスやったほうが色々と捗るぞ
やねうら王 @yaneuraou さくらインターネットでの機械学習の勉強会で発表してきた。発表、不慣れなものであまりうまく出来んかったが、もっと経験を積みたいのでちょくちょくこの手のイベントに参加していこうと思った。 あと将棋ソフト開発者の皆には来年さくらインターネット様から素敵なプレゼントがあるかも。(ないかも) きたああああああ
>>338 将棋連盟公認のところはソフト締め出しがキツかったからなぁ
floodgate以外にコンピュータ将棋開発者から常時ソフトを流せる場所が皆無
>>340 金がなくてーとか計算資源がなくてーと言い訳していた連中はさくらに乗ってGoogleに喧嘩売らないとなw
さすがやねうらお
>>338 ソフト指しするクズゆとりなら沢山いるけどね
やねうら王? @yaneuraou さくらインターネットでの機械学習の勉強会で発表してきた。発表、不慣れなものであまりうまく出来んかったが、 もっと経験を積みたいのでちょくちょくこの手のイベントに参加していこうと思った。 あと将棋ソフト開発者の皆には来年さくらインターネット様から素敵なプレゼントがあるかも。(ないかも)
確約ないのに公表するってののがうまいよなあ さくらもう引けないじゃん
ずる賢さでは(でも?)将棋開発者の中じゃトップクラスだからな
日本勢のカミカゼアタックは見てみたいが、 手遅れかな。
今年の電王トーナメントでも多少問題になってたけど、来年は深層学習勢が増えたときに 公平なハードとはなにかっていう問題が出てくるよなどこまでGPUやTPUを認めるのがルール として最善なのかってのは答えがないわけだから、、
電王トーナメントのCPUもGPUはメインストリーム最上位と相場が決まっている CPUはOCなしのモデルになるが
DLのみで出場だと1080Ti1枚とかだと結構きつそうだな
ツイッターでデマ拡散したuuunuuun1がチェスガチ勢にキレられててワロタ
人間に勝っただけでドヤってた将棋ソフト開発者の哀れさ 本気の勝負になったら絶対勝てないからスペックガーとか言い出す 第2回電王戦をスペック制限無しでやったプロ棋士を見習えよ
スペックガーどころかfloodgate出てこいとか言ってるようだが
WCSC27で1000コアの技巧とPonanzaは32コアのelmoに負けてる 雑魚ソフトはスペック良くしても雑魚ソフトのままだろ
スペックだけでは中々埋まらない差はあるけど、実際深く読むと強くなるのも事実
Takuya Akiba? @iwiwi
DeepMind の AlphaZero チームの方を捕まえられる機会があったので、将棋について
http://www.uuunuuun.com/single-post/2017/12/07/Some-concerns-on-the-matching-conditions-between-AlphaZero-and-Shogi-engine …
とりあえずこのページを見るように伝えてみました。チームに共有してくれると約束してくれました。
コメントも見るように伝えたので言いたいことが他にある人はコメント書くと良いかも。
>>361 もうアホ晒すなよ
汎用に専用で勝負して恥ずかしくないのか
ソフトでプロに勝ってプロはソフトより馬鹿って騒いでるのと同じだろ
汎用で専用に勝てるとか言ってる馬鹿がいるんだからしょうがないだろw
Qhapaqの人は投了値900ならelmoに9割勝てるソフトも作れるらしいから 公開されるまで待とうぜ
alphazeroの一番の貢献は、PONANZAなき今一つの目標ができたこと。
正直、DMからしたら「floodgate? どうも注目されそうにないな、べつにいっか」ってなりそうな気もする。 来てほしいけど
誰かこれに触発されてAWSにジャブジャブお金つぎ込む開発者いてほしい
日本の天才()プログラマーダサ過ぎて笑う 囲碁8時間、チェス4時間、将棋2時間ってマジで低レベルな競争だったんだろうな
まあ日本のは個人の趣味だからしゃあない 誰か優しい人が5000万プレゼントすれば数日でR4500になるだろ
より強力な将棋ソフトの開発を競うメタゲームとして考えれば汎用のほうがソフトで 専門のほうがプロということになるな
40年間苦労して発展を続けてきたのに2時間で全否定ww
プログラムから作る汎用AIで専用AIに勝利 @悪い見方 ↓ 今までのソフトはただのおもちゃだった ↓ おもちゃ作りに一生懸命になってたプログラマーはカス A良い見方 ↓ シンプルに、alphaZeroは今までのプログラマー達よりも賢い ↓ 新文明の到来
行き詰まりを感じていた開発者のほとんどにとっては明るい話だろう 一つのゴールが提示されたんだからそこに達する道はいろいろある
>>374 ニューラルネットもモンテカルロもそして、コンピュータ将棋のαβも長い歴史があるよね。
過去の多くの技術者たちの努力あって今がある。
AlphaZeroは将棋はあくまでも通過点でしょ。 DeepBlueの後に更に強いPCのソフトが続々出たけどIBMが動じないように 仮にやねうらおとかがシコシコとソフト使っても立場がひっくり返ることがない。 「我々は次のステップに移行するから、限定的なところで頑張って」 と言われたらおわり
今までの将棋ソフトの下積みに関係なくAlphaZeroは今の強さを発揮できる。今までのソフトくだらねぇ って話かもしらんが、それ言ったらAlphaZeroだって将来的には画期的な汎汎汎汎用AIでも開発されて、 NNやらなんやらの下積みに関係なくAlphaZeroを超えるAIができあがり、今までの歴史下らねえ ってなりかねん。 あんまり結果ばかり重視しすぎじゃなかろか。 結果に至るまでの仕組みの探求も大事だろうというか
>>331 引き分けがあるのが欠陥と言ってるのはそれこそ脳の欠陥だぞ。
ドローの意義:
第一に、形勢判断が複雑になる。たとえば「六分四分で有利」と言っても、10局指して6勝4敗になりそうなのか、
4勝2敗4和か、それとも2勝0敗8和なのか。また「どちらが有利か」の判断よりも「有利の程度がドローの幅を超えているか」
の判断のほうが難しい。知らない人には想像もつかないだろう。さらに消去法も効きにくい。ドローのないゲームなら
勝ちにならない手順はすぐに捨てていいが、チェスではドローが最善の結果かもしれないのだからそうはいかない。
ドローで満足するか、形勢不明の乱戦に踏み込むか、悩むところだ。だから棋風の違いも出やすい。
第二に、先手の利を中和している。ドローのないゲームで研究が進むと、全部先手勝ちになるおそれがある。
囲碁は昭和初期にそういう状態に近づいてコミを導入したし、将棋の名人戦では最近10年間(55期〜64期)の
先手勝率が7割を超えている。チェスでは「先番の利」が「ドローの幅」とうまく釣り合っている。
白が勝つか、黒がドローに逃げ込むか、あるいは白の指しすぎを誘ってうっちゃるか、研究が進んでも興趣は失われない。
第三に、競技会の観戦もおもしろくなる。結果が3種類ある分、展開が多様になるし、大詰めでは他のゲームの進行を
見ながら互いにドローで満足するか勝ちにいくかという駆引きがある。
第四に、棋力測定の効率が高くなる。ドローのないゲームだと2局指したとして結果は2、1、0勝の3段階だが、
チェスなら2.0から0.0まで5段階に分かれる。
日本には戦略目標が1種類しかなく、結果も2種類しかないゲームがある。チェスより複雑だと思っている人が多いらしいが
不思議でならない。サッカーやボクシングでもドローの名勝負は多い。チェスはドローが多くてつまらないという人は
「自分は内容を味わう力がない」と告白しているだけである。
http://hnishy.la.coocan.jp/chessterms.htm >>381 を俺なりに補足すると
「負けを回避する」のに「大ギャンブルで勝ちを狙う」しかないのか、それとも
「無理をせずにドローを目指すのか」で、将棋は前者しか選択肢が事実上ないけど
チェスは選択肢が2つある、というのが「ドローの幅」であり、「先番の有利を
補っている」ということであり。
あと、チェスのスコアは「○勝○敗○分け」ではなく「勝ち1分け0.5負け0」の
勝ち点方式で表示され、こうなると引き分けがネガティブではなくなる。
(シリーズの勝敗がトータルスコアの和で表示される。世界選手権15番勝負の結果が
「1勝0敗14分け」とされるか「8-7」と表記されるかは全然印象が違う)
個人的には、昔サッカーも勝ち点が勝ち2分け1だったのを勝ち3分け1に変えた
経緯があるし、勝ちの勝ち点を3にしてもいいのではないかとは思ってるが、
>>333 (リンク先URL弾かれるので引用のみ)
最近の統計を見てみましょう。
Chessgames.comというチェスの棋譜のデータベース(70万局くらいなのでもしかして少ない?)では
2013年時点で白の純粋な勝ち率37.4%、黒の純粋な勝ち率27.4%、引き分け率35.2%で白の勝率55.0%
(つまり黒の勝率45%)となってるらしいです。これはほぼ全部マスタークラスの方々の棋譜だと思います。
他の時代や他の場所の統計を見ても例えば最近のコンピュータのレーティング戦の統計だと
CCRL 40/40 Rating List July 26, 2014
White wins: 35.2%, Black wins: 25.9%, Draws: 38.9%, White score: 54.6%, Black score : 45.4%
CEGT 40/4 Rating List 26 Jul 2014
White Wins : 39.5%, Black Wins : 29.4%, Draws : 31.1%, White score : 55.1%, Black score : 44.9%
白の勝率52%〜56%、つまり黒の勝率44%〜48%です。
・・・これってそこまで先手有利か?
やねうらおだってブログで似たような煽りやってたけど でも現実にここまで将棋ソフトの積み上げを無視されると 開発者も反論したくなるのも分かる。 でも大半のキメラだの定跡がどうだの ライブラリ流用して大したことして ない連中が色々言うのはただただ見苦しい
こんなとこでもこの話題がずっと続いてるんだから、世間に与えたインパクトはでかいな。狙い通りじゃねえか
あんまり訳わからんリプしてると 将棋民ウザッてなって 次の論文からはシレッと外されちゃうよ …てな趣旨の発言をやねうらおがしてた
論文に著者連絡先の記載なし、査読なしの論文をarxivで公開したのは悪手だった説
145 名無し名人 2017/12/10(日) 11:05:23.26 ID:yBvli5X7
1900点って自分のことだったのか。
将棋クエスト棋譜【2分】 (garnet_crow[2395] 対 tylers2002[1950])
http://wars.fm/shogi2/game/ui5dd8egpuqq #将棋クエスト #ShogiQuest
>>386 そのツイURLキボンヌ
あるいは文面コピペでも
コンピュータ将棋基礎情報研究所のSilver論文の私的解釈が興味深い。 今回の論文のポイントはコンピュータ将棋やチェスにおけるミニマックス法の有効性を考え直す必要があるって意見のようだ。 評価関数の形じゃなくて問題は探索か
評価関数が超有能なら探索は割と適当でもいいみたいな話なかったっけ?
>>390 いま現状最強である(パラメーターも限界まで調整済み)やねエンジンですら
非手番でとんでもないと読んでたり、メイト外れたり色々あるからな
あれがバグじゃないとでもいうんだろうか
刈っちゃいけない枝を全く刈ってないとは言えないよなっていつも思う
刈っちゃいけない枝を刈ってることがあるのは論理上当たり前
>>394 枝ってより、候補手5番にもならないようなゴミ手を読むんだよね
例えば駒を取る一手なのに何故かコチラに一手パスして取らせようとしたり
やっぱりちょくちょくバグレベルの手あるよなー 評価関数がもっと精度あがれば枝狩り甘くしても上手くいくのかな?
>>395 理論上がどれほどなのかも分からんけど
floodgateで対局させてると3〜5局に一回は確認してる
それが勝敗に結びつくかはどうかはおいといても
非手番はポンダー外れる程度だとしても手番時に読みぬけや
大逆転される原因は多少ありそうだけど
誤解がないように先にいっておきますが やねさん批判のつもりはないです
floodgateで見てもそれが探索によるものなのかわかりづらいのでは? その局面で評価関数にゴミ手がいい感じの評価値として学習されてたのかもしれないし
やねの探索は序盤めちゃめちゃ枝刈って終盤は枝刈り少ないってイメージ
>>400 その辺は数種類の評価関数や一世代前の読み太なども使ってみたんですけど
探索が悪くないと仮定するとキメラの弊害?とも思った事ありますが
キメラしてない評価関数でも確認できたんですよね
ディープブルーもオリジナルボナンザも枝刈りなんかしてないだろ 当時将棋がよくわからなかった保木はともかく 枝刈りが安全確実なら当時のIBMの人間が枝刈り処理を入れないはずがない
まあ確かにやねエンジン同士のさらに同じ評価関数ミラーで対局させても、明らかにおかしいことはあるんだよな 手番のとこの関係で同じ局面でも同じように評価してるわけじゃないと思うけど、読み抜けっぽい評価値の急変はあるよね
今度同じ現象起こったら棋譜から検討モードで原因少し探ってみます
ここにグダグダ不満書く時間はあるのに その探索不具合直すコード書く時間はないのなw
読み抜けって言っても 枝刈りによる読み抜けと、探索深度が浅い事による読み抜けの2つが・・・
実際常にdepth32くらいまで読めていれば起きない読み抜けなのかもしれないってのはあるけどね
>>407 >枝刈りによる読み抜けと、探索深度が浅い事による読み抜けの2つ
だから限られた時間内では枝刈りの度合いと探索深度は兼ね合い・バランスの問題になる
いいとこ取りなど論理上あり得ない
常に超絶ハイスペックPCでしか動かさないソフトなら、それ専用にコード書いたら絶対今より強くなるよね やねさんは省メモリ化を初めとして家庭的なPC目線で開発してるからありがたいわほんと
>>403 両方当たり前のように枝刈入ってるし…。
>>386 578 自分:名無し名人[sage] 投稿日:2017/12/10(日) 15:43:04.87 ID:P96HOLJr
AI竜星戦版絶芸
10月のAlphaGo Zeroの論文を参考にして8月版絶芸に勝率100%
旧絶芸に2子で勝ったバージョンより強い
時価総額アジア1位のテンセントでも、ちゃんと論文参考にしたと言うのになあ
まあそのレベルの企業だからともいえるけど
馬鹿みたいに僻んでる奴って何なんだろうな
中国人以下の見苦しい反応は恥ずかしいからやめてくれ
時価総額50兆あれば再現できるんだよ
やねさんも記事更新してる。 αβと深層学習の詳しい話が聞けそう。
どこかがスポンサーになってやねさんに1億くらいプレゼントしたらすごく面白いと思うんだがなー
他の役に立たないプログラムに金使うわけ無いだろどアホウ
>>417 とか言ってるから、日本のIT企業(笑)はテンセントに負けてんだよ
日本のIT企業と海外の本物のIT企業を比べちゃいけないんだよな
無差別級ではAlpha Zeroが最強かもしれないが 駒得オンリーではひようら王が未だに最強だし(震え声) とはいえ探索部も googleがディープラーニングでパラメータ調整すれば 駒得だけでももっと強くなりそう。
一生懸命車をチューニングしている脇をスペースシャトルがぶっこ抜いたイメージ 将棋ソフト開発者も凄いんだけど来ちゃいけない相手が来た
AlphaZeroがプロ漫画家で、 やねうら王とかが同人作家
なんか的外れだなー、AlphaZeroはそもそも将棋用じゃない 色々な料理を扱う三つ星レストランがラーメンを作ったらラーメン屋よりうまかったってとこだな
マイナースポーツを内輪で楽しんでいたら 室伏広治(未経験者)がやってきて 初日で一番強かった感じだな
なら恥じることでもなんでもないな 才能が違うんだから
5000 TPU 2時間って TPUv1 (INT8 92TOPS) = V100 (FP16 120TFLOPS) として p3.16xlarge(V100 8個 1時間2400円) * 625 * 2時間 約300万円ぐらい スポットなら100万でいけるかも
>>425 >>426 汎用と専用の区別を失念していたw
すまん
将棋自体ほとんど日本国内でしか指されないし、蛙になるのもまぁしゃーない
「俺このマイナースポーツなら行けるんじゃね? 」 ↓ 室伏「12時間の練習で君らの誰よりも一番上手くなったぞ」 ↓ 「やっぱり身体能力には勝てなかったよ・・・ 」 ←いまここ
100m走の日本人が10種競技のイギリス人にまるで歯が立たない感じ?
↓ 「室伏広治でも追い越すのに12時間かかるなんて俺ら凄い!」 いまの流れはこうだぞ
せっかく将棋専用なんだから資金募るとかなんとかして ちゃんとやればだいぶ強いからねって見せておいてほしいもんだ
その12時間で今までの将棋ソフト開発者が使った以上の コンピュータ資源をつぎ込んでるという
まぁGoogleはもう将棋に興味無くしただろうし Googleの成果を国内のプログラマがどう活かせるかの問題になってきそう でも個人レベルで組めるクラスタでは無いので無理かもしれないね
計算資源を開発する期間無視してるの恥ずかしくないんですかねぇ・・・
>>436 それ言い出すと
身内のAWSをじゃぶじゃぶ使えない
貧乏開発者からブーメランが飛んでくるぞ
趣味の延長線上でやってた開発者はすげーってなるだけですむけど、ponanza完全に負けしまったな
負けなかったとしてもponanzaがAlphaZeroほどの成果を上げて
>>378 のようなこと言って
勝ち逃げしてたらボロクソ叩かれてただろうな
>>365 それができるならなぜ作らなかったのかな
評価値がプラス900になったら中身をエルモに替えるだけのプログラムで全勝できたのに
>>442 仮に終盤は専用ソフトのほうが強いとしても、評価値がプラス900になるまではDLで読ませて、そこから先は専用ソフトの手法で探索させれば最強ソフトになるわけだからね
ハサビスに先を越されたことになるよ
何言ってるかよくわからんがポナ方式の評価値で切り替えバージョンってことか?
900で投了ならelmoに9割勝てる→それ以上続けると逆転されることがある→途中で関数変えれば最強では? ってこと?
あー、なるほど、山本はプログラム開発を短距離走としてとらえていたわけか、、、 長距離走としてとらえていたやねうら王のほうが賢かったし、山本はもう体力ギレで立ち上がれないなw まあ、Googleは車だけどなwwwやねうら王は他の全プログラマーの悔恨も結果も全部しょい込んで、車に切り替えたほうがいいよ。
まあハサビスさんもこんな面倒くさい連中相手したくないよなあ もっと煽れば以外にあっさり将棋最強なんて諦めてすぐに消えてくれるかもよ?
入玉ルールとか詰みルーチンに対応してないとしても難癖にすぎないと思うわけよ 900点差をつけられるソフトを開発できたのなら、そこから先は従来の評価関数で探索してもよいわけだからね 画期的なのは明らか あとは棋譜の公開を待つだけ
平岡 拓也??\(´・_・` )/??? @HiraokaTakuya
AlphaZeroに負けてるの悔しいので、今まで計算量的に諦めてた手法で学習やって勝てないか足掻いてみます(´・_・`)
AWSなどでLinuxの計算用サーバー使える方でご協力頂ける方はは以下のリポジトリからダウンロードして実行をお願い致します(´・_・`)
https://github.com/HiraokaTakuya/apery-machine-learning 将棋ソフト開発者はなりふり構わず強くなろうとしているが、 Googleはそういう勝負をしたいわけじゃないからな Googleが本気でなりふり構わず強い将棋ソフトを作ろうとしたら、もうとんでもない次元のものが出来るわけで でもそういうことをしても、一部将棋オタにしか価値が無いソフトが出来るだけと分かっているから、あえて汎用AIの一環として王道的に手を出したに過ぎない 将棋ソフト開発者がやっているのは、 世界的数学者に対して「俺円周率10000桁まで覚えてるんだぜ。すごいだろー」ぐらいのレベル
>>454 その汎用AIで倍の時間かけて誰も圧倒的にかなわない強さにして棋譜だせば全ての人が黙るわけだが
やれない時点でお察しされるのはしょうがない
>>453 参加するのはAWS、Linuxが必要なのか・・・
win環境でいいんだったら6950xで参加できたのに
やっぱり外との通信だとコスト的に結構な金額いくもんな。 あとオレゴンじゃないのな
WSLは遅いから意味ないと思われ・・・ 素直にCDからLinuxブートして参加するのが良いんじゃなきあん
>>453 汎用に専用で挑むなよw
勝っても虚しいだけだろ...
>>461 強い将棋ソフトが見られればそれでいいよ
そもそもディープマインドと競えるのはプログラマじゃなくて科学者だし
また月刊最強評価関数が見られるのか。 ワクワクするぞ。
624 名前:名無し名人[sage] 投稿日:2017/12/10(日) 21:04:49.85 ID:7cDccpPx [24/26] @囲碁バカの経緯 「囲碁は将棋と違ってソフトには絶対負けない(キリッ」 ↓ ボコボコにされて大敗 ↓ 「Googleが凄いだけ!Google最強!人間が弱いわけじゃない!」 ↓ 「Googleが最強将棋ソフトも作った!将棋ざまあみろ!」 ←今ココ いかに底辺低知能のゴミばかりかよくわかるよね 無能のくせにプライドばかり高くて現実を認められない 自分のプライドを守るための思考回路ばかり働く 朝鮮人そのもの これが将棋ファンですか
>>460 WindowsもしくはLinuxのAPIを使わないコードなら
そんなに速度劣化しないよ
分からん・・・ 平岡さん「認めるとこは認めたほうがいいんじゃないですかね・・・プロ棋士のプライドがよく分からない」 今回リソース集めるなら自分じゃ無理だし余計な手間かけたくないなら 正直協賛金募ればいいだけじゃないんですかね・・・ それこそ開発者のプライドは理解できない 金ですむんなら投げてやるのに やね氏だって110億で20万くらいじゃなかったか?
将棋ファンって一つの意見、一つの人格しかないのか? いろんなこといってる人がいるだろう? 都合のいい人だけセレクトして理屈並べりゃ、どんなことだってそうなってしまうだろうよ。 ナンセンス。
>>467 そういう人が存在してることを認識できてないんだよ。
なので、平岡さんにいくらまでなら協賛できると直接いってみればいいんだ。
>>467 平岡 拓也‹‹\(´・_・` )/›› @HiraokaTakuya
12月7日
返信先: @HiraokaTakuyaさん
計算力乞食も仮想通貨乞食も大して変わらん気がするのでVALUやってみるか(´・_・`)
VALUやるから投資してあげな。 仮想通貨での協力の準備も進んでる
開発しながらの生配信もしてほしいな 喋りながらコードを書けるのかはわからないけど
VALUなんて回りくどい事しなくても 口座晒せば振り込むのに
えび「プログラミング放送はびっくりするほど人が来ない」
このままだと日本のプログラマーは田舎侍 ってことに収束するよね。
まふ定跡とは? wcsc27 elmo定跡にひたすらスナイプされた定跡 SDT5 shotgun定跡にスナイプされると開発者から判断されて決勝でクビにされた定跡
今回の件で誰が一番被害デカかったと言えば、 DeepMind社の専門家が膨大な計算資源を使って、 コンピューター将棋をディープラーニングしても こんな程度までしか出来ないって分かってしまった、 ディープラーニング勢の未来。
確かにAlphaZero と将棋の神の間には うすら恐ろしい壁がありそうだ。
>>480 囲碁・チェスもそうだが、全勝出来なかったのは、
まだ競技自体の力は強いということだしな
>>481 elmoの8勝してしまう所にふと怖さを感じた。
頂上の手前に深い闇があるのかなあ。
AQの作者の人が興味深いこと言ってるな ライブラリの強い制限を課すことによって逆に独創性が失われていってるのではないかと 将棋は流用が簡単だからこそ多様なオリジナリティあるプログラムがたくさん出てきてるのではないかと
言うほど多様なオリジナリティあるプログラムが沢山出てきてるか? やねうら王チューニング大会と化してるが
>>482 eloレーティングの推移
https://m.imgur.com/h0Nspsz 将棋だけ追い越した後、他と違い不安定に
そこがおそらく、あなたのいう闇
オリジナルティがあるとは書いてないようだが 敷居が下がれば色々な試みが行われて棋力向上につながるのではと書いてある
人間を遥かに上回る性能をこんな程度で片付けるの・・・?感覚麻痺ってない?
>>485 これについてDeepMindはどう考えてるのか知りたい
>>485 軽く下がってそうな所とか気持ち悪い。
恐ろしく微細な指運みたいなものがまとわりつく
のかなあ。
AlphaZeroでもレートがジグザグに伸びてるんだから 3駒もサチったと思ってもすぐには諦めてはいけないね
低スペにも優しいと噂される やねうら王のSDT5版はいつ出るんだろうか?
Mac(High Sierra)で将棋ぶらうざQ上でelmoを動かそうとしているのですが、
解析開始時にオプションからBookDepthLimitを0、ConsiderationModeをonにして
「設定」をクリックしても設定画面が閉じず反応がありません。
「取消」を押すと画面が閉じますが、もちろん設定はデフォルトのままです。
これはバグでしょうか?
http://fast-uploader.com/file/7068471953750/ >>492 rezero19の事?
110億教師が公開されてるから自分で出来るけど
このスレですら学習させたの1人くらしかいないでしょ
やねうら王が公開するかはさておき
ここの住民はしょせんキメラ程度しかしないで文句足れて自己満計測しかしない上
人が公開された制作物に寄生するガイシって事だよ
だから誰も公開しない
>>483 AQ作者とかいう10万ガチャを何回もやってる謎の金持ち
alphaZERO「私は将棋を1%も理解していない」
>>495 低スペは暇人がやるしかないよな
下を向いて進んでも誰も得しないし
よく考えるとある一定水準までは強くできるけどそこからどんどん鈍化して止まっちゃうって事だよね 精度の高いものが要求されるものには使えなそう
>>500 ほとんど上限まで行ってるだけだろ
そもそもたとえ鈍化しようともそれが人より精度が高いのなら文句無しに有用
Google社員さん、こんなところにも出張してきてるのか。 ふえー、お疲れ様です
日本に「高邁な視野で走る集団」が出ないから いつだってチマチマした事になる。
例の110億学習させた人いたら教えて欲しいんだけど、どのくらいの強さになった?
ニワカ知識だけどα-β法を使わないで囲碁と同じようなモンテカルロ探索をしているらしいけど そのモンテカルロ探索を考えたのはフランス人で今回のDLはグーグルでアメリカ人でしょ? 囲碁もそうだったけど日本って強いソフト作る割にAIの発展に貢献してる感ほとんど無いよな 何かちまちま微調整して強くしてるだけって感じ
>>495 制作物に寄生して導入記事書いてるスパムモンか?
自分のスレにおとなしく帰りなさい。
>>483 「人間にはソフトと違い、個性がある!」のソフト否定論を、
今度はソフト開発者側が言いだすとは…
>>507 何言ってるんだ?
お前は全員スパムモンに見えるメクラか?
>>506 元々、情報学のサンプルとして囲碁を研究、提案、発表するというより
Ponanza山本のように閉じてコミュニティで上位を狙うタイプが多かったからね。
情報が少なくて参加する開発者の絶対数も少なかったし。
将棋もBonanzaが出てくるまでは同じ雰囲気だったけど。
でもまあ今でも将棋ソフト開発と言うよりライブラリハックみたいになっているけど
>>506 DeepMind社はイギリスの会社だけどな
ニワカというかヘッドライン見ただけで晒したいだけだろお前
>>506 多分
日本人: ゲームに勝つためにソフト開発
外人: ゲームに勝つほどの知的なプログラムを作るためにソフト開発
今回の件だって日本の大半の将棋ソフト開発者はあくまでも強い将棋ソフトの開発だがDMは人間以上の思考能力を持った知能の開発を目的としその能力を将棋でテストって感じだからな
目的が違うから必然的に新しい学習理論への関心の差は出てくるだろう
>>514 そういう汎用人工知能の確実な未来が見えてるのに、いつまでも(恐らくこれから一生)将棋ソフト開発だけに時間をささげるというのも虚しい人生だな…
ネット掲示板で将棋ソフト開発者をディスりに時間をささげるというのも虚しい人生だな
>>516 将棋ソフト開発者がたかが専用プログラムのクセに汎用人工知能で将棋を攻略したプログラムに対して棋譜ガー、スペックガー、資金力ガーとかネット掲示板でイチャモンつけることに時間をささげるというのも虚しい人生だよな?
将棋ソフトの開発者さんたちもDeepMindもすごい。
>>517 はうんこ。
Apery+やねうら王の誤情報導入記事を無許可で書いた人が暴れているのか。
stockfishが1勝もできないのは 評価関数の差が想像以上に勝敗を分けたと仮定する。同じ理屈だとエルモも勝てなくなっても不思議じゃない。何故エルモが8勝出来たのか。ここは興味深い 将棋とチェスのゲームの違い、探索量の差?によって精密な評価関数を作っても 勝敗は覆る事もあるという事なのか? さらに力技で精度を上げるか 探索量増やせば3駒の評価関数では 1勝も出来ないのはレベルまで行くのかもしれないけど。それはお互いさまで 結局どちらが筋がいい かという話だけど、これから先のことを 考えると学習自体にリソース割いて実行環境はコンパクトにしようとする アルファゼロのアプローチの方が今の状況では優位なのかな?
理解してないってレベルじゃなかったよなあの変な手順 伝言ゲームの最後の人に手順聞いたらこう答えましたみたいな
棋譜についてはどんな指し方するのか見てみたいじゃん レートの数字だけ見てもつまらんだろ
電王戦がスペック制限で分散型システムを閉め出したことで 保木・金子他大学関係者は全員退出 企業も参入しづらくなった 結果分散型計算リソースの大規模な利用が事業の中核であるグーグルとは対極の コンソール型PCに閉じた効率化の途を辿ることになった 袋小路だったんだよ
汎用AIじゃないとインフラとして売れないじゃないですか
本命の医療系で目に見えた成果でないから遊び論文で時間稼ぎの感があるな
スペック制限は電王戦だけでWCSCは何でもありなんだが
>>525 ここの医療分野への応用は人類への貢献とするための体裁の様に思える
おそらく今メインでやってるのはこのボードゲームよりもずっと戦略的、そしてより戦争に近いRTSだと思うよ
いやあ役立つだろうなあ
戦闘機のパイロットなんて育成コストとリスクが大きいから是非とも応用したいところだろう
保木は自分の研究の化学プラント最適化プログラムが将棋に使えるんじゃね?と思って 試してみたら動いちゃったのがきっかけ その「チェスソフトの応用」ってよく言ってるやつがいるがどっからわいた話なんだ?
Bonanzaだって最初は他の将棋ソフトのライブラリだったしね
>>529 今の強豪ソフトはストックフィッシュのコードをかなり参考にしてるという話では?
違った?じゃあそれまで将棋には向かないとされていたチェスで有効とされてる全幅検索を将棋でもやってみた ってだけか
gghideki? @gghideki_katoh
DCNN の推論(実行)速度が 100倍になったら,PN をそのまま使って
rollout できるから VN は要らなくなりますが,そんなに先のことではないかも知れません.
そうなると今の囲碁 AI はさらに強くなります.
https://twitter.com/gghideki_katoh/status/940087538814877697 将棋でも本格的なDLの時代が来そうね。
PolicyでRolloutする暇があったら、メモリーたくさん積んで Value使ったツリーサーチで幅と深さを広げた方が良いかと。
>>523 分散勢はアルファベータで成果が上がらなかった時点でお察し
締め出しが原因じゃない
技術的に電王トーナメント勢に負けたんだ
つまり敗走だ
汎用AIに専門AIで挑むなよ言う話があるが、コンピュータが1から自作したソフトに人間の技術 というか論理的思考と言うか、そういうのがどこまで通用するかは興味がある 名声とか立場はひっくりかえらないとかそういうのとは関係なしに、いろいろ気になって 知りたいことがあるし、黒魔術化した過程をすこしづつ言語化して解明したいという気持ちもある
序盤はモンテカルロ、中盤は評価値、終盤は詰み探索か。 くじらちゃんモンテカルロ実装しないかな?
Deep Learning自体が黒魔術の権化だったりする罠
クジラちゃんは大規模クラスタのオーダリングにディープラーニングを使いたいとは話してた。
囲碁もチェスも棋風が他と全然違うもので同等以上の強さのソフトが出来たってのが一番意味あることだな。
alphazeroの妙手をstockfishに一時間考えさせても指せないみたいな書き込み見かけたけど 同じようなアルゴリズムのソフトばかりだと両者見落としている好手ってのが潜在的に結構出てるんだろうなって思った
>>544 棋風が違うってどこでわかるの?
棋風違いで強さ同等が事実なら、まだまだ神の一手からは
ほど遠いって事なんだろうけど。
グーグルは失敗続きでAI分野はピンチだからこういう誤魔化しはしょうがない気がする 自動運転失敗 翻訳失敗 医療先こされて失敗 あとどこの分野に入れるのよ?
googleには逃げないでほしいね スペックでゴリ押しして勝ち逃げというパターンだともっと最悪だが
膨大な計算量があれば+900で打ち切りでよければ単純なパターン網羅でもelmoに10割いけるソフトは作れると思う
>>549 +900までの全パターンの定跡作るにしても
リソースが相当いるはず
suimon@floodgate_fan
社会人になると褒められることなんてほとんど無くなるけれど(他の人はわからないが)、この数字は僕の心を穏やかにしてくれる。
ハイスペ1手1分のelmoを相手に? 定跡の効果は短時間対局なら大きくても 持ち時間が増えたらそこまでアドバンテージ大きくならないでしょう そもそも現状の最強ソフトで900打ち切り条件だとelmoに100戦で何勝するのか知らないけど
ソフト厨って開発してないのにソフトに感情移入しすぎなんだよな
>>532 パラメータの自動生成もやっぱチェスから持ってきたの?
主張したいのは汎用性の進歩なのに +900がどうとか、対して強くないとか グーグルはさぞウザがってるだろうな
今は数時間かかるが近い将来これが数分下手したら数十秒で人類トップを超えられるようになるだろうから、ボードゲーム系のAI開発する人は居なくなるのだろう
プログラマー「人間より俺等のソフトの方が強いからプロ棋士イラネw」 ↓ AlphaZero「ジャップのカスソフト一瞬で超えたからお前らイラネw」
せっかく秋葉がAlpha Zero関係者に言ってくれたのに、uuunは何も反応しないんか
チェスは論文に12種類の定跡でSFとやった1200局の結果載ってる 290勝24敗886分 uuunはそれもわかってない、論文を見てすらいないんだろう
>>554 横レスだけど、パラメータの自動生成はオセロがやってるね。
英語が出来ないとアンジャッシュのコントみたいになるから 正直に英語できる人に聞くのが正解 あの秋葉先生がDEEPMINDの方に言って貰えるなんて本当に凄いことだよね。
エアリプよろしく
37 名無し名人 (アウアウエー Sadf-QogF) 2017/12/11(月) 20:36:41.21 ID:k4/SXDUka
anti_suimon=suimon の完全な証拠
http://imepic.jp/20171211/738451 http://imepic.jp/20171211/738450 ・suimon にブロックされている anti_suimon が suimon へのリプをいいねしている
・ブロックされているから suimon のツイートは見えないはずであり、不自然ないいね
・anti_suimon がいいねしたツイートはこれだけであり不自然
スマホのツイッターアプリでアカウントを切り替えるのを忘れてsuimon宛てのリプにanti_suimonでいいねした模様。
今必死学習続けて発表した内容に追いつけるように頑張ってる気がする 追いついたら棋譜だしてくれるでしょう 追いつけなきゃずっと出てこないかと 毎回そうだし
囲碁に比べれば、チェス、将棋は簡単で、最難関の囲碁を制覇したからにはやるとはおもってなかったな。
daigo? @daigog
[Floodgate/Shogi-serverのお知らせ] 復旧しました。また、レーティングにおけるベンチマークプレーヤーを変更しました。
今後は、gikou2_1cのレートを3300として表示します。
http://wdoor.c.u-tokyo.ac.jp/shogi/ >>569 FXはそもそも大元が全員分の取引内容を把握した上でサーバーAIで価格動かしてるから
値動きだけを見てテクニカル的にクライアントAIでどうのこうのというのは不可能で
こういうのは100%集金目的な詐欺案件
将棋AIやFX AIよりもこっちの方が実用的で凄いと思ふ
自動色塗りAIも凄いレベルにまで来ている件【絵師不要?】 [567836569]
http://2chb.net/r/poverty/1512996927/ AlphaGo Teaching Tool
https://alphagoteach.deepmind.com がやっと出たが既存の
http://www.josekipedia.com をちょっと追加しただけのもだと判明
グーグル終わる
この程度のものを用意するのにもグーグルは半年もかかるもよう 色々がっかりすぎて全て怪しくなった
知恵遅れが何か賢しらなことを言いたいけど何も思い浮かばないから 「ぐーぐるがキフを出さないのはあやしい」と連呼してるだけw
これからのAI開発はプログラマより科学者の仕事になりそうだし、 AIの出した結論を解明するって感じでかえってプログラマのほうが科学者的な立ち位置に なるんだろうか これまで趣味でやっていた将棋ソフト開発が仕事になるみたいな、開発じゃなくて研究だけど 金になるかどうかは別にして 飛行機が飛ぶ原理が分からなくてもAIが飛行機を開発して運用することはできるし、いっそのこと 実用的な仕事は全部AIにまかせて人間は趣味や研究に時間を費やしてもいいのやもしれん AIへの信頼問題になるか
上にもあるけどgoogleが出すといいながら囲碁に関するtoolを出さないのは 論文に書いたレベルにまだ到達できてないって割と有力
株取引なんて大手のイカサマにどうやっても太刀打ちできないだろ
このままGoogleには将棋にはお触りしないでもらって数十年後巨人Googleが恐れた日本人がいた!とか語り継がれて欲しいね
チェス → IBM 囲碁 → Google 将棋 → 個人開発 将棋は個人で開発しているので、ゲームの複雑さの割に強いソフトが出ないと言われていた IBMやGoogleが開発していたら2005年頃には名人を超えるソフトが登場したろ思われる 将棋もGoogleがちょっと手を出したら、あっと言う間に最強ソフトに勝率9割強のソフトが開発された
しかしpona本もFXに手を出すなんざ、堕ちたものだな でもそれを言い出したらなんたらおさんも昔は競馬予想サイトたる怪しいものをやっていた訳でもあるが
Googleのせいでソフト開発者がゴミになってしまった
新しい手法を褒める前に粗探しして潰そうとする 日本人の悪い考え方だよね
この程度の企業戦略で騙される人ってよく生きてこれたよね 安全な国日本ならではだろう
メディアの報道は論外として、論文ですら嘘にならない程度に限りなく書く側に 都合良く書かれてる場合がほとんどだと思うんだけど、そこらへんわかってるのかな
>>571 ,574
技巧2とgpsfishのuuunさんとこのレート差が890だから、それが1cだと
400から500差ということは、4c8tになったときのlazySMPの効きがかなり
デカイってことだね。
>>576 alphagoの評価値が出てくるだけでも全然価値あると思うけど。
しかし初手の黒番評価値がMAXでも47ってことはコミ7目半キツイんだな。
(下手したら将棋の初形における評価値差より大きいだろ)
そこから最終的な勝率が五分に近づいていくのが面白いところではあるが。
https://alphagoteach.deepmind.com/ja めちゃくちゃ面白いは面白い。囲碁の打ち方に革命が起こるな。
ただ、これで勉強できる人とできない人でディジタルディバイドになりそう。
今の囲碁業界を支えてる高齢者はボコボコにされてやる気なくすかもしれず、それが気がかり。
意外と小目からのツケヒキ定石はじめ、ミクロで見ると人間に全然理解不能みたいな手は少ない。
>>597 実際の勝率はそれより差がないんだからまだまだalphagoも完璧じゃないんだろう
>>597 強化学習って後ろから順番に正確になっていくから、序盤の方の評価値は
あまり鵜呑みにしない方が良いかと。
>>599 というよりは、7目半のビハインドと先番の利を初手の段階できちんと評価することが
難しすぎて(前者の明確さに比べて後者が不明確過ぎる)、ってことじゃないのかな。
(もちろん究極は初手の段階で100か0かのどちらかなんだからそれに比べればほど遠いのは仕方ないとして)
>>598 こんなこともできない老人は負けて当然じゃね?
というか今どきのじいさんはネット好きが多いぞ、暇だから
>>575 ディープラーニングがより発達すれば気に入った絵柄を数点入力したら
その絵柄の塗りを学習してその塗りを真似てくれるソフトとか出てくるのだろうか
まさにシンギュラリティーだな
google先生にはぜひ3コマ関係の限界を見極めてほしい。しないだろうけど DLによる学習が3コマ関係と合流する可能性とかあるんだろうか
DLが3駒の特徴を学習しきったとしても純粋に3駒だけで強くなったかどうかは確かめようがないかな 黒魔術の世界は手作業でひとつひとつ確かめるしかなさそうだ。実用性からは程遠い趣味の世界
>>604 DNNのどっかの層の一部は2駒関係、3駒関係見てるんじゃないの?
総当たり総ざらえはしとらんだろうが。
>>605 その必要が無いってのがAlphaZeroの発表やろ。
110億局面をAlphaZeroの学習済みバリューネットに食わせて勝率=評価値出させて、
それを教師として3駒に学習させて近似させるってことは可能だろうけど。
AlphaZeroよりちょっぴり弱い3駒ができるだけか。
>アルファ碁ゼロの強化学習はたった 3 日で終わったのか? >この 3 日間という数字は、私の仮説では、4TPU 搭載マシン 1000 台程度の環境を使った結果です。 >CPU を 1 個だけ搭載した普通の PC を使った場合、手元の計算では 20,000 年かかる計算量です。 >アルファ碁ゼロはマシン 1 台でも強いのか? >ここでのマシン 1 台は、4TPU 搭載マシンを指しています。これは CPU2400 個もしくは、GPU120 >個程度の並列に相当する膨大な計算量になります。決して、我々が簡単に入手できるようなマシン上 >でもアルファ碁ゼロの強さを再現できるわけではないことを強調しておきます。
>>611 人によって桁がずいぶん違うもんやね
山口 祐 @囲碁ソフトAQ開発中? @ymg_aq
AlphaGo Zeroが72時間で人間超えてやべーってなってますけど、真にやべーのはこの学習を3日で終わらせるGoogleのマシンパワーですから。
私のPC(GTX 1080 x2)だと、同じ学習を完了するのに62年程度かかります。Master超えバージョンなら735年です。
この人Googleの第一世代TPUと第二世代TPUの区別がついてないのではないか
Googleはプロセスメーカーじゃないんだから ハードについてはGoogleができたことは他社がすぐ追いつく
おまえらはAlphaGoZeroとAlphaZeroの区別もついてないだろ
>>575 そういう系統の究極系はまさにこれだと思うわ。
まさにドラえもんの世界はそういうディープラーニングの発想の先駆けを行ってたんだな。
しかしこと画像変換(動画変換)系のシンギュラリティについては
もっと凄い事になってるよ
アメリカ人の天才、AI技術を使ってガル・ガドットやテイラー・スウィフトのAV動画を作成! [965031448]
http://2chb.net/r/poverty/1513064523/ スペックがーはともかくなんとかで何年とかいう説明は素人にもわかりやすいんだわ
google先生が第一世代をメルカリにでも流してくれるといい
stockfish作るのに使ったマシンパワー
Games played
601170189
CPU time
878.97 years
http://tests.stockfishchess.org/users なお将棋の探索はこれを流用
将棋所でのaperyのエンジン設定の詳細わかる人いますか?
ずっとやねうら王使ってきたから気がつかなかったけど apery エンジンの説明って言われてみれば見つからない
Apery、オプションをやねうら王ほど細かく設定出来ないし、やねうら王より一回り弱いし、オプション設定のドキュメントもないし…
Aperyはデフォルトで十分使える設定になってるから設定いじる必要ほとんどない もちろん細かく設定したい人には不親切だと思うが
SaberTigerの定跡ってテキトーだよな(笑)
DLだと将棋でもモンテカルロに近いことをやってるみたいだけど、 DL使ってNNを学習させきった後でαβの評価関数として使うと、やっぱりうまくいかないのだろうか
YSSの人も言ってたけど今のalphago zeroをはたしてMCTS探索と呼んでいいか疑問ではないか
non-Monte-Carlo Tree Searchなんじゃね?
日本唯一の世界トップ分野AVまでお株奪われる危機か
ブスにあだ名をつける分野でもコンピューターが勝ち名乗りを挙げる日も近いな
>>626 凄いなこれ
序盤でハメられてもなく自力思考で17秒考えて大悪手か?
それともゲロ博士の手術の賜物か・・・
ただAperyもaperypaqお評価値の乱高下っつうか見落とし多いよな
博士はよ公開
17号どうこうじゃなくてSaberTigerのそこの評価値が歪んでるんじゃないか?
>>637 そうかもね
何かのキメラだと思うけど
しかしR4100越えてるであろう評価関数が歪んでてても
序盤でこんな大悪手指すもんかね
>>638 学習に定跡使ってた場合、その定跡に問題がある状態で序盤の教師局面を作ると
過学習チックなことが起きてこうなるんじゃないかと思う
>>639 ほぇ〜そうなんか
定跡ハメは見るけど結構衝撃だったわ
SaberTigerって上位陣だし
もちろんああ指したら勝率0って訳じゃないけど 個人的にソフト同士で勝率高い手ではない気がするな aperypaqとかも先手数手の評価を+100とか言い出すし(その後負ける) 序盤はいい定跡で補う方式に頼らないと勝ちづらいかもね
alphazeroのフル論文みたくて一睡もしてない
>>642 フルペーパーは待ち望んでるわ、棋譜はきちんと載っている信じているんだが
>>641 検討で確認してみたけどaperypaqで2億5千万で七8桂成を見つけるね
それまで六2玉で互角程度
2億5千万までいくスペックにも左右されそうだけど
五5桂のを打たされたら終わる手順なんだね(五5桂が最善に選ばれやすい)
ハメ定跡に登録されそう
>>644 教師をもっと深い読みで作るしかそういう事故は減らないと思うんだよね
開発者の方々にはなんとかして資金調達してdepth16とかで教師作ってみてほしいわ
>>646 そうなのかな?
最終的に見つかってる手ならあらかじめ深い探索の評価値で学習されていれば
すんなりいくんじゃないかと思ってしまったが
そもそも候補にならない手とかだと話は変わってきそうだけど
>>645 まだまだ序盤でも大ハマリの可能性があるのが興味深い
depth16だと、やねさんのXeon40c80tで1億作るのに2か月・・・
そう考えるとリソースの進化を待つより学習方法の見直しを迫られそうですね
囲碁より将棋の方がパターン数(全局面検索)は多いよね? 現実的な手だけではなく全局面全ての手の話で
>>648 結局大量の教師局面がないと過学習なところが問題なんだよなあ
でもAdaGradよりはるかに教師少なくていいなんて中々難しいと思うし
AlphaZeroのTPU5000台みたいな感じでごり押しするしか今のところなさそう
>>650 悩ましい限りですね
開発者もそうだけど技術者はあらためて最先端で奮闘してるって分かった気に少しなれた
>>651 シグモイド関数使ってるけどそれをReLUとか他の関数でできないかとか
ドロップアウトだとかを試したらもっと広い局面に対応できないかとか
そもそも負けた場合教師として使うべきなのかとか
逆転のされかたによってどのくらい学習させるか変えるとか
色々気になる部分はたくさんあるけど、たぶん開発者の人達はこのまま終わらせる気はないと思うから応援するわ
>>650 過学習ではないだろ
序盤と終盤を汎用の評価関数でやろうとしたことによる問題
序盤を定跡に頼らず一直線に悪くなる変化を避けられるか
終盤はこれまでめんどくさいから放置されてきたがいよいよ終盤専用ルーチンの実装に迫られる
Aperyが電王トーナメントで先手で負けたのも似た変化の将棋だったはず。 早指しだと▲5五桂を早めに打ちすぎて負けるパターンが出やすいやつ。
序盤にそんな穴がある限りはまふさんの高笑いが止むことはないな。
>>653 どっちかというと探索の問題だろう。
読み切った訳でもないのに危険な一本道に踏み込むから途中で修正が利かなくなる。
読み切ってないのにαβを使うのが不味いのかね。
手番を失った時に評価値が急落する筋は危険だと評価するべきかも。
やっぱAlphaZeroにも似たような穴があったりするんだろうか。 AlphaZeroの強さを疑ってるわけじゃなくて、純粋にそういう部分を確かめたいから棋譜をみたいし floodgateに加わってほしいと思うのだ
読み切ってαβって、それゲームの完全解明じゃん。 それができないからの評価関数であり、枝刈なわけで。
将棋ソフトが強くなればなるほど終わりは近づくよ。 誰が1番乗りかの競争だなあ。
>>627 基準が3300になったから当然
前は2800基準でmax4100程度だから
そのうち4600程度までトップは上がると予想
基準が変わっても 1敗するまで弱いのとしか当たらないのは相変わらずだな
まふ氏って5000円くらいのi3でAVX使えないPCじゃなかった? それが4000万ノード(このスレでもいるけど何でそのノードに拘るのか)で まふ評価関数とApery、aperypaqで1000局づつ計測したって言ってるけど やねさんぐらいのリソースないと無理じゃない? uuunuuun氏基準?の計測だと1500万ノード付近で揃えていて 1500万でi7使用時に5秒とかじゃなかったっけ やねさんからrezero19を先渡ししてもらっててキメラした後出しジャンケンみたいな事ばっかり言ってて どうも信用できん 野生の読み太さん他だいたの人がAperyより+40〜50だと数値だしてるの変なの
単純にPC買ったんだろうなと思ってたわ ちなみにi7-8700Kで2秒で1500万くらいだと思う
>>658 本人が「必勝定跡ではない」「把握してる穴もあえて残しているものもある」って
言ってるだろ。
>>661 2週間レートのgpsfish_normal_1cは元の2800に近づきつつあるし
いずれ長期レートの方も2800に収束するだろ。
そもそもがgpsfish_normal_1cとgikou2_1cで試験対局やって3300にセットしたんだろうし。
最上位ソフトのレートがわかりやすくなるはずだから3300はいい変更だと思うわ
あれ、もうgpsfish_normal_1cは水門に投入されないのか?
>>664 そうなると約5秒で2000局・・・・
あっ、察っし
>>669 ハイスペなPCなら1時間で15局くらいはできるから1週間だな2000局は
gpsfish_normal_1cが消えたのはsuimonのクソツイのせいだろうな。
これぐらいの将棋とか言ってるけど、gpsfish_normal_1cの方がsuimonより強いだろw
https://twitter.com/floodgate_fan/status/938005585743638528 suimonはほんと 変なこと言うし 誤導入記事書くし ハイスペyaselmoを謎なソフト名で流して自己満足するし 将棋ソフト界隈で一番ひどいわ
yaselmo-suimon_40cとか名前つければ誰も文句ないもんな なんでソフト名つけないで変な名前にするんだろう
特大ブーメラン。 評価関数の変換コマンド間違い記事を執筆してしまったやつが何か言ってるんだよな。 suimon@floodgate_fan 返信先: @nissui1982さん 確かにこういう記事を書くのなら、業界についてもう少し調べてほしかったです。 午後5:40 · 2017年12月13日
ion1zation_feat.suimon_80c これがベストでしょう
まふさん ググったら、Googleアドセンスはクリック報酬型のアフィリエイトって書いてあったよ まふさんはアフィリエイトをやっているんだね
Google AdSenseがアフィリエイトじゃないとは知らなかった
>>666 だって必勝定跡じゃないし〜って言い訳がましいんだよ
じゃあなんのための定跡なんだ
ぼくのかんがえたてじゅんです、とくにいみはないですってか
まふ定跡とは? wcsc27 elmo定跡にひたすらスナイプされた定跡 SDT5 shotgun定跡にスナイプされると開発者から判断されて決勝でクビにされた定跡
>>659 まあ究極的にはそういうことだけど…
人間が読みを打ち切る時は、詰みまで読まなくとも、局面が落ち着いて自陣に隙がないとか、攻めながら駒得して相手の攻めゴマを外してるとか、
打ち切っても大丈夫な区切りまで読むのでは?
時間がたっぷりある理想的な場合だけど。
KPPT&αβのように、とりあえず攻めが40手繋がってて、駒損だけどあと10手くらい繋がるだろうからいいや、では打ち切らないだろう。
MCTSはその轍を踏まないのだろうか?
>>681 もし先手が必勝定跡なら必ず後手は負けることになるし、後手必勝定跡なら必ず先手が負けるじゃん
定跡っていかに互角の手をたくさん作るかってことでしょ
なんだかんだ言ってsuimon定跡は優秀 嫉妬するのも分かるわ
まふさんに質問 まふ評価関数は、一般公開するのですか? それとも、開発者だけで回すのですか?
alphazeroの自己対局の先手番、後手番の勝率、千日手率などが気になって一睡もしてない
DualXeonオナニストがいると聞いて来ました。
>>683 将棋のαβってquiescent searchで、盤面が安定するところまで探索延長
しているんじゃないの?
>>609 今の3駒でも不要な評価してる箇所もあるだろうし4駒の評価もすべて求める必要がないはずで
どういうコマの組み合わせが最善かを設計する
そうすれば数千万npsでNNと同等の精度の関数が手に入る
>>683 あと、MCTSでは特にそういう事は考えない。
もともとAny timeなアルゴリズムだし。
>>684 いや、あれ必敗であっても定跡に入れてるとか意味わからんこと言ってるんだけど
互角じゃない手が入っていることに対してそういう風に作った定跡ですと言い訳をしているのがアカンわ
当時定跡軽視のポナ憎しで過激な発言してて、その反論に対する予防線で色々言ってたことの一つだけど、ツッコミどころ満載だったよ
>>694 3駒のパラメーターのほとんどが強さに寄与しないのが現状
もっと効率的な評価関数の形はtanukiの派生チームが研究してる
ひまわりくんはどうせコマンド打てないんだから黙ってろ
透。 さんが 動画を投稿しました。
動画【国民栄誉賞へ】羽生善治「永世七冠」記者会見 生中継
http://www.n ;icovideo.jp/watch/sm32413223?_topic=nicovideo_user_video_upload&ref=zeromypage_nicorepo
Demis Hassabis @demishassabis
If you play chess, you'll like this highlights reel from IM @DanielRensch.
really demonstrates the unique playing style that #AlphaZero has.
Stockfish doesnt seem to understand these positions very well.
Also note that #AlphaZero uses 1000x LESS search!
ダウンロード&関連動画>> VIDEO 仮に今DeepBlueと同じようにハード中心のチェスマシーンを全力で作ったとしたら どれくらい強くなるんだろうか?
>>696 まふ定跡は、3駒関係が誤解する局面で相手の悪手を的確に咎める手を登録した
アンチコンピューター定跡だろ。
定跡が初手から連続した先後共通の互角の手を前提とする現状の定跡データベースのフォーマットにおいて、
まふ氏のように後手の悪手を咎める妙手を登録しようとすると、
敢えて後手の悪手を採用率低く登録して、
その先の先手の応手を登録する形をとらざるをえんだろう。
>>703 アンチコンピュータ定跡ではありませんって本人が言ってたんだよなあ
所詮その時々のメタ定跡だから簡単に結論覆るよねって反論に対する言い訳なんだろうけど、上塗り重ねすぎてなにが言いたいのかよくわからん状態になってたよ
ポナ批判とか横歩先手必勝とかの主張を通すためだけに無茶苦茶なこと言い過ぎだったねあれは
ponanzaが負けたのも自分の定跡の功績だと本気で思っている痛い人だからな
>>704 まふも結局は俺が×2の自己主張の塊
スパムモンと一緒
スパムモンはyaselmo導入PV上げの目論見から
tamore公開時にはtamore_40cみたいなので放流してたでしょ
floodgateなんて定跡スナイプ大会になってるだけで何の面白みもない
負けた原因が定跡に押し付けるバカばっかりだし
>>706 自己主張って悪なの?
自己主張と自己主張がぶつかるから見てて面白い。
痛い自己主張がなければ、それを安全な場所から生暖かい目で眺める愉悦も成立せんよ。
残念ながらポナ山先生が引退されてしまったので、
今後のコンピュータ将棋の盛り上げのためにも、
痛い自己主張をするキャラは、みんなで大切に育てていかないと。
>>707 承認欲求と自己主張のガイジを擁護か?
自己主張と個性を発揮するのは番うぞ
まふ定跡搭載aperypaqを定跡無しでボコれる評価関数が登場すればいいのかな?
>>706 定跡スナイプがないといつまでたっても序盤に大穴抱えたまんま、
「これで人間よりはるかに強いからいいんだ」
の自己満足で終わってたから、ないよりマシだろ。
それをまふ氏個人の責任にして八つ当たりしてる今のスレの状況は
正視に耐えない醜悪。
3駒はまだ伸びしろあるけど実質もうこれ以上絞れないというのが現状? というかもうこれ以上強くならないって確かめようがあるんだろうか、AlphaZeroもそうだけど
まふ定跡なんかより月刊教師局面が気になるわ、クリスマスプレゼントとか言いそうな予感がしてる
>>700 チェスはポーン以外全部大駒みたいなもんで、駒得重視で評価関数が軽量だったけど、
将棋同様に位置関係が重要だったってことかね。
誰か三駒関係でチェスソフト作らないかね?
elmoはかなり位置関係を評価してるから、AlphaZeroに抵抗できて…2時間…ないか…
全ての局面が正しく勝ち負け引き分けとラベル付けされた 究極の?教師局面セットを使って学習させたとして それで強い評価関数ができるのかって疑問もあるしな
>>717 強いのはできるだろ間違いなく
ただその究極の完全解析教師を作ったものより強いことはありえないだろうが
まふガイジ降臨で草 アフェイカスで反応して張り付いてるなら 早く4000万ノードとやらの棋譜でも晒せ 気になってしょうがないんですねw
>>700 これ見て思ったけど自己対戦だとレーティングが過大になるって話があるけど
似たような棋風のソフトだけの場合も過大になってる可能性あるんじゃね?
Alphazeroに似た棋風のソフトをレーティング測定に入れたら今のソフトのレーティングが下がるわけだから
>>717 そんな局面セットがあるんなら、それを直接参照するだけで事足りる。
いちいち、その局面セットの近似関数をでっちあげる必要性はない。
日本って欧米のソフト、発明をパクってちまちま弄ってるだけで本当にしょうもないよな
elmo超える前に一瞬伸び悩んでるし、そっから何を悟って強くなったんだろうか
>>717 それはもう完全解析済の三目並べとかでやってみるといいよ。
ちなみに結果は最強の評価関数ができあがる。
そんな極端な教師を使って三駒で上手く行くかって話だよ まず三駒の表現力では学習時の誤差はちっとも減らないだろうし
>>712 自己満足してるのはまふとスパムモンだろww
ion1zation_feat.suimon_80c
>>715 ヒント
Googleは回収を視野に各種巨額かけているので
そういうことが出来ない者が負け犬の遠吠えを
言うのはダサい。
負け犬の遠吠えじゃなくて、どんなに金をかけてもより計算資源をつぎ込んだらさらに先があるんじゃないか という疑問が尽きないという話をしてるんだと思うわ
単発IDとsageない奴が自演してたり別人装ったりしてるだけ 気づかれてないと思ってるのは本人のみ
やねうら王KPPT4.79、まだバグあるんだけど 先読み中に、明らかな悪手を読んで評価値が大きくマイナスになる
確かに極端にノード少ないと100局に1局くらいある気がする でもそこそこのスペックで数秒かければほとんど無いと思うが
>>712 ソフトが完全じゃないことなんてわかりきってるし、それでも総合的に人より強いのはなんも変わらん
評価関数が更新されれば定跡の評価も変わるわけで、定跡に開発リソース割くのは有意義でないから重きを置いてない
対定跡で穴が見つかったところで、現状穴を塞いでいくような開発手法じゃないし、穴なんていくらでもあるんだからミクロな開発はやるもんじゃない
まふが批判されるのはこういう前提を無視して都合よく定跡マンセーやってるから
定跡作ってるだけなら文句言われることもない
1900点が鬼門なんだよな
将棋クエスト棋譜【2分】 (amamda1698523[1924] 対 garnet_crow[2372])
http://wars.fm/shogi2/game/w04qcck7xlsj #将棋クエスト #ShogiQuest
まふってアスペの上に話し盛るし嘘つきだよねw やねブログの書き込みみても分かるけど 他者の事を理解できないで自分の事ばかり主張するガイジ
>>741 ソフト開発は続いてレートも上がり続けてるのに開き直りねぇ
根本的な改良じゃなくて、穴を定跡で塞ごうとかしてるほうがよほど開き直ってるように思えるが
ソフト厨は 定跡厨vs評価関数厨 この対立になったんだよな もうプロ厨が相手にならないから
>>743 定跡でパッチあては、思考プログラムとしては美しくない。
しかしここまで人外レベルで強力になったソフトさえも、序盤の穴は、ソフト解析併用した人間がふさぐ必要があるってのは、過渡期の現象とはいえ興味深い。
穴があるって所詮は自己対戦かfloodgateのような短い持ち時間の中での話しだろ
>>626 みたいな定跡切ってて出現する可能性も咎める可能性もある
勝手に決めた短い時間でスペックも分からないようなもんを正当性があるように言う事がナンセンス
DMの凄さだってハード面の進捗著しいから比較されるだけで
スパムモンの40cを昔にもっていけば「このCPUだと今までかかる時間が短縮されて比べようがない」とか言い出しそう
何にせよ議論の余地がないほどズレてるわ
大会用に定跡作るのはメタゲーでしかない
お前の事やぞ まふw
開発者に干されたスパムモンが開発者と親交のあるまふさんに嫉妬して暴れて消耗してるの?
開発者に重宝されるまふ定跡 開発者に敬遠されるひまわり定跡
まふさんはDL勢に対する侮辱じみた物言いがなあ Google否定するためにDL勢全体巻き込むか
うむ、AGZのペーパーやな 絶芸チームはこれ読んで一ヶ月改良して前バージョンに100%勝てるようになったんやろ
>>724 三目並べだと、BASICしか知らない小学生がIF-THEN並べて最強ソフト作れるしな
まふガイジは掲示板に反応するんだから早く根拠のR4200らしい棋譜だせ 非開発者で4200超えてる透への嫉妬ですか?w
キメラでR4300とか言い出すやつ現れたらまた流れ変わるんだけどな
>>756 透だってR4200超えてる証拠の棋譜ないじゃないかw
9:00〜10:35 プレミアムカフェ 将棋 渡辺竜王vs人工知能 ボナンザ(初回放送:2007年)
まふさんと透さんは互いに情報交換して切磋琢磨していそうなイメージ
渡辺明は2007年に1局勝ってからはソフト戦から勝ち逃げしたんだよな 叡王戦で優勝してソフトと対戦して負かされるのを恐れて、去年も2年前も同棋戦の参加を拒否した
>>765 飛車が下段にいるのが嫌だったんだろうが、高段者じゃないとわからんだろこんなん
ひまわりはもっと弱いと思うが 級位者くらいだと思う
5分1500点だもんな 1900点の人達に失礼なレスだった 以後気をつけます
ふと思い出したけど昔いたゾロアくんってまさかひまわりじゃないよな?
>>763 B to Aの10年。
(Bonanzaに始まりAlphaで閉じた)
>>771 17号は、たまさんのじゃないよ。
本人が言ってた。
>>774 え、そうなんか・・・期待してたのに残念
そうなると誰だか限られてくるような気もするが
suimon@floodgate_fan こういう将棋はfloodgateをいくら見ても感覚がつかめないので、そう言った面でも人間の棋譜からも考える必要性がありますね。 午後8:17 · 2017年12月14日 suimon@floodgate_fan 実戦的には有力。 午後7:58 · 2017年12月14日
これが県代表クラスの真の力
・鬼殺し縛り ・横歩取り45角縛り ・対振り飛車人間側無条件でビッグ4 ・人間側木村定跡先手 ・ゴキゲン中飛車側必勝パターン これぐらい名人がハンデもらってもソフト全勝しそう…
>>781 木村定跡先手はどこからやるかによるな
最終局面からなら、相手がソフトだろうが勝てる
ほかは無理
定跡系でもっとも有名なのは角換わり腰掛銀の富岡定跡だけど、 あそこまで進んじゃうと、ソフトがいくら強くなっても無理だよ 小さいプラスからどんどん数値が大きくなっていって、すぐに軌道修正効かない局面になるから 文字通り先手の必勝定跡
>>776 やったぜ
でも第二世代って、ポケモンだと互換が無いんだよな(意味のないたとえ)
>今後TPU podはGoogle Cloud経由で提供され、TensorFlowを使ったプログラムで利用できるようになるという チェイナー終了のお知らせ
http://www.uuunuuun.com/single-post/2017/12/15/ elmo評価関数だと魔女とやねうら王が大きなR差があるが、apery sdt5評価関数だとやねうら王と魔女は互角という謎の現象が起きてるとか
URLがおかしかった
http://www.uuunuuun.com/single-post/2017/12/15/ 評価関数を固定したときの探索エンジンの比較:Aperysdt5評価関数で魔女復活?
間違った ×TPUはしないことからもお察し 〇TPUは市販しないことからもお察し
開発者の池さんも計測に参加してるからそれは考えにくい
353 名無し名人 2017/02/20(月) 00:14:16.60 ID:ht9aCl68 音楽を始めたのは将棋を辞めたいと思ったから でも結局、上記のように何をしようが一緒だった 将棋も卓球も音楽も根本に大差はなかった 卓球も本当にイヤだった 露骨に態度で示してくる奴がいて 最後は途中で辞めた それ以降、付き合いはない 卓球は音楽よりは適正はあったけどまぁそこまで強くはなかったな 弱小大学の体育会の部内で中の上くらい 将棋も卓球も勝負事でもう嫌になってそれで音楽をやったけど実態は…だった 今はもう一つ趣味はあるけどこれは勝ち負けも上手い下手もなくて平和だな 何かは言わないけどね
まふ@まふ定跡開発者? @mafu_op_theory 13 分13 分前 その他 返信先: @uuunuuun1さん、@snooze1mitsuyaさん、@YasuhiroIkeさん tanuki- sdt5と1手4000万ノードで500局終わったんですが、 apery sdt5と互角までレートが伸びていますね。 棋譜見るとapery sdt5は 「短時間では突破しづらい駒組み」をしています。 よって、ノード数が伸びると「やね探索」のほうが やっぱり強い結果になると思います。
そういうのはノードを深くしたときの対局結果と棋譜を公開してから発言すべきかと。
DL版のponanzaって、やってること自体はAlphaZeroとあまり変わらないのか? ponanzaのほうがあまりDLに依存してない感じだけど
2時から再放送 2:00〜3:35 プレミアムカフェ 将棋 渡辺竜王vs人工知能 ボナンザ(初回放送:2007年)[再]
たま@人造棋士18号? @mm_Tamachan_mm 18号が将棋倶楽部参戦中。 18号は1コアで参戦してるので、10万NPSぐらいですから、ちょっとした腕試しにはいいと思います。 将棋ソフトを入れてないけど、ソフトと対戦してみたいという方はどうぞ。
おいおい、折角やねが素材提供してくれてるのに誰1人として学習してみてないじゃん ホント口だけで役立たず揃いのスレだな
>>805 やったよ
floodgateにも流してたよ
そもそも開発者以外の結果報告なんて望んでるやついないだろ
誰も学習してないとどうやって判断してるんだ、超能力かよ
ちなみに、学習のさせかたが悪いのかもしれんが yaselmoよりやや強いくらいかなくらいの評価関数ができた etaとlamdaをどういじってもAperyを超えるのは厳しそう
>>809 lambdaだな、突っ込まれる前に訂正
ひまわりくん! 頭の悪い人の文章を書き込み続けると脳に影響があるそうですよ! mztn7@mztn7 ネットで叩かれるほど有名になったつもりはありませんが…。私は名誉や称賛及び批判や非難に全く興味がありません。失礼ながら頭の悪い人の文章を目に入れたくないので2chは見ません。脳に影響があると困ります。
やねうら王SDT5版が公開されるまでは学習はApery1択でしょう
>>808 自分がしてないことは他人もしてないと思ってしまうんだな
やね学習部ってAperyと違って 省メモリ化のためにKKP/KPP配列をfloat型やdouble型などで別途持つような実装にはせず 生のKKP/KPP配列を用いて、この小数部として8bit(int8_t)を補助bitとして1バイト変数に持つ っていう感じで実装されてるらしいけど、これがAperyの教師のほうが浅い探索で作られてても 強くなった原因なのかな? 詳しい人いない? たしかにやねうら王の学習部はメモリ食わないから庶民に優しいけど そのせいでレート100も損するならメモリ使いまくる実装でもいいから勝ちに行ってほしいわ
WCSC27の時点でも elmo+探索で、低スペックや短時間なら、 魔女は最新やねにまだまだ全然負けてないって報告はチラホラあった記憶
ググるの棋譜は公開されたのか。 ほんとに強いんだったら日本人がやってる3、4、5駒とかいうアプローチはもうダメだろ。 囲碁の方で仕入れアルファ碁の情報だと、全体を見る、全駒相当のはず。 ○駒というのは人間が評価項目を設定するのが大変で手抜き目的なのと、 少ない駒数よりかは多い方が強いのは明らかってことで採用してみたら上手く行ったことでしょ。 勝ち負けは別にして、○駒評価がそんなに適切な評価とは思えない。
>>817 あれだけの計算資源を投入してTPU4台で動かして
ややAlphaZeroに有利な対局条件で対局して
R3900のelmoに9割しか勝ててないから
将棋ソフトとしてはあんまり効率良くないと思うな
もっとハードのスペックが進化すれば全駒でどんどんやったらいいと思うけども
ちなみに全駒の線形評価関数って、64bitコンピュータで可能なの? 組み合わせが64bitを超えてて無理です、みたいなことにはなってないの?
>>819 素人だからわからんけどやねさんがまあまあな駒数まで挑戦してたし一応できそう
ただ学習にメモリ1ペタバイトくらい使いそうだなw
>>818 効率いいだろ。学習的にも読み量的にも。
アルゴリズム的にはモンテカルロ一本では終盤になるほど不利だとおもうが、それでも勝ててる。
「AlphaGo」から進化 将棋とチェスでも世界最強「AlphaZero」 - ITmedia NEWS
2017年12月06日
学習の結果、チェスのStockfishには4時間(30万ステップ)で、
将棋のElmoには2時間(11万ステップ)の学習でそれらのレーティングを上回り、
8時間(16万5000ステップ)の学習で韓国のプロ棋士・李世ドルさんを破った初代AlphaGoを上回った。
3日間学習させたAlphaGo Zeroに対しても、24時間以内(約38万ステップ)に性能で上回った。
学習を完了したAlphaZeroとStockfish、Elmo、AlphaGo Zero(3日間学習)を、それぞれ先攻後攻を切り替えて50回対戦させたところ、どのケースでもAlphaZeroが他のAIに勝ち越した。
AlphaZeroとAlphaGo Zeroは4TPUを使用、StockfishとElmoは1GBのハッシュサイズと64スレッドを用いた最大レベルで戦わせた。
AlphaZeroが他のAIに勝ち越し 1秒当たりに読む手を比較すると、Stockfishは7000万手、Elmoは3500万手と膨大な量を読んでいたのに対し、
AlphaZeroがチェスで8万手、将棋で4万手と従来のAIに比べて明らかに少ない手数しか読んでいなかった。
「AlphaZeroはディープニューラルネットワークにより最善手に当たりをつけ、より『人間らしい』アプローチで探索している」と、論文では指摘している。
http://www.itmedia.co.jp/news/articles/1712/06/news138.html 将棋のAIって他に応用の効かない技術だって言ってた人が なんでFXには役に立つって宣伝になるのか 大人の世界怖い
朝鮮人の性だろうな ほんとあこぎなことばかりする屑だ
>>822 大量の計算資源を使って、終盤行く前に評価値で切らないといけないようではまだまだ効率のいい方法では無いと思うよ
読みの量はノード数的に少ないだけであってむしろ計算資源的には多く読んでいるくらいのはず、同じ時間で対局しているんだから
>>817 AlphaZeroがあんだけマシンパワー使ってあの程度でサチってる以上高効率とはとても…
Alphaって実際どう思考してんだろう、探索と評価がシームレスなんかね 現行のN駒自体はろくな精度じゃないのに、静止探索とツギハギで組み合わせただけで人間を凌駕する精度になるのも魔法感あるけど
suimonさんがブログ書けないくらいのレヴェルに達したからなぁ
alphago zeroのグラフからみると、全然深さと要素が足りないんだと思う 40層、512チャネルくらいでやって欲しい 計算量数十倍になると思うけど
>>795 まふさんって異常に4000万に拘るけど根拠あるのかな?
>>809 rezero8 R3850
野生の読み太作者も学習させたものが+R130程度と
http://ii.ttlv.jp/20171203/ R3850+130=R3980
手元で110億学習させたものはyaselmoより明らかに弱いよ
もしyaselmoより強く出来る数値があったのなら教えていただきたい
地獄の学習タイムをもう一回味わうけど
学習効率がいいというのは以前のアルファと比較しての話で、読み量的に効率がいいというのも そのかわり1局面の評価に時間をかけているので、一概に効率いいとは言いきれない気がする。 ○駒評価がAlphaZeroと比べるとそんなに適切な評価じゃないかどうかはこれから証明していく 課題になるだろうし、従来の手法を試す意義はもうしばらく続くか 上手くいかないことの証明って、あんまりやる気起きないだろうけど
>>831 すまん書き方が悪かったが、rezero8に対して学習させたわけじゃないんだ
ちなみに学習するときeta(可変)、lambda(2)、ミニバッチサイズはどんな感じで設定してる?
>>833 そうなんですね
あまり知識がないので
eta30
lambda1 3
lambda2 3
にしました
もし可能でしたら何に学習させたのかと数値お聞きしたいです
クリリン嫁と指してみたいな 10万ノードなら普段指してるスマホ技巧よりもだいぶ劣るし勝つチャンスありそう
>>834 とある評価関数のキメラをdepth9の30億教師で絞ったもの(yaselmoよりやや弱くエロ河童よりは強い)に学習させた eta1 0.01 eta2 10 epoch100(本当はもうちょっと大きくして限界まで攻めるべき?) eta3 0.1 epoch10000 lambda 0.67 500まで lambda2 0.5 ミニバッチサイズ 100000 こんな感じでやったけど自分も色々試し中だから全く最適では無いと思う とにかく過学習をおそれて控えめな感じになってるかな やねさんが月刊教師局面してくれるらしいから、今自分が作ってる教師と合わせて色々やってみようかと思ってる >>837 オリジナル評価関数なんですね
・・・depth9の30億!!!???
凄い計算資源お持ちのようで羨ましい
>>838 yaselmoみたいに偶然ものすごい強さのものができない限り
公開とかそういうことはするつもり全然ないけどね
ゲーミングPCなんだけど最近ゲームもあんまりやらないし、有効利用って感じで使ってる
depth9は結構時間かかるけど一般人でも遊べるレベル、それ以上は中々厳しい
シボラーと言われる人達は計算資源どうやってるのか気になるね
>>839 野良シボラーは
野生の読み太 AWS
透。 Xeon
この二人しか成果出せてないようなので是非参戦してほしです
>>840 正直Xeonでも結構上位じゃないとこれからは厳しくなってくる
うちのPCはシネベンチで1200そこそこだからdepth10で100億は到底無理だし
AWSに手を出すか計算資源クレクレする以外に方法はないから
おとなしくやねさんがAWSにジャブジャブお金使ってくれるのを待つのが一般人的に賢いと思う
その人らみんなshotgunの教授みたいな大学の研究者みたいな人ばっかりなんだろな
>>841 leela zeroプロジェクトの将棋版とかワンチャンあるんじゃない?
leelazeroってもう10級まで来てんのかw 将棋でやるやついるかな?
Alphaの棋譜、1万円なら買う。直ぐ払う。見たい。
これは一体何だったのか suimon@floodgate_fan というわけで目標としていた2450点に到達したのでクエストを引退します。今までお世話になりました。 今後は将棋クエストで頑張っている人のサポート役として将棋クエストと関わっていきたいと思います。 今後はさらなる高みを目指す為、ShogiDroidでソフトと指すようにします。
floodgateのmob_sp1と技巧を見る限り、例の教師局面で学習させると、角換わり腰掛け銀48金45歩型を指すようになるみたいだね。
クリリン嫁、序盤は荒いね。変態すぎるというべきか 今24にいるレベルなら3000点以上の人なら何割かは勝つと思う。
次回、世界コンピュータ将棋選手権は廃止になってしまいますね。
>2018/5/3(木)?5/5(土) 第28回世界コンピュータ将棋選手権 @川崎市産業振興会館 ま た 川 崎 か
二枚落ち最強は銀多伝か二歩突き切りか それとも全く別の下手必勝法があるのか アルファ先生なら答えを出しそう
ねこてんさんの残り香を探す
suimon@floodgate_fan
ねこてんさん、引退はしないとのこと。
Twitterは辞めるそうです。
nemui_nekotenさんの写真 (link:
https://instagram.com/p/BcuSkeUHjPO/ ) instagram.com/p/BcuSkeUHjPO
>>850 いつぞやの木更津でやってた時に比べれば遥かにマシ
>>855 川崎の会場もも木更津の会場も行ったことがあるが、双方に良さがあった
川崎は場所が良いので行きやすい
木更津は景色の良いアクアラインを通って海ほたる見物もできた
会場でPCを並べて対局しているのを直接見られたのも良かった
このご時世に会場をわざわざ設置する必要があるのだろうか
川崎の会場は歩いて行けるのでネットと大してかわらん…
仕事で褒められてから言おうな。 suimon@floodgate_fan 返信先: @IHayatoさん 将棋界も藤井聡太四段をはじめとして若手世代の台頭が目立ってきています。 AIの発達で勉強方法の知の高速道路が整ったからです。 彼らに負けないように最新技術を取り入れ頑張るしかないです。 午前7:02 · 2017年12月17日
>>865 会場から駅の反対側には永瀬父のラーメン屋もあるしね
途中に楽しいところもあるよ
なるほどね、合点がいった wakameがR4200で17gou_KPP_KKPTも透氏の作成したオリジナルなんだ ブログ見る限りだと近々公開されるみたいで良かった
17gou_KPP_KKPT、かなり強かった。 いままでのKPPとは違う。(KPPは嘘でない?って噂まであったし) シボレーで成功できるのは凄い。 あれだけの時間&費用投資する気力が失せたわ。 更に強いの期待してます。
>>870 KPP_KKPTはSDT5のやねうら王が大体のレートまで公開してるのにどう嘘になるのか……
まあ透氏の環境はxeonだから普通のi7の2倍以上でRAMも沢山積んでるし 良いほうの計測だとポンポコ同程度だとすると大体分かるような気もする kpp,kkptはノード高く出るみたいで測定に近いような
完全に粉砕されてしまったんだよな…
ソフト指し判定頼む。
スパムモン擁護はしないけど 専用スレでやってくれんかね・・・
真面目にフリーランスし続けているsuimonさんが可哀想でさ 同情に値する
>>872 噂してる人がいただけだ。
事実言っただけ
いちいちクレームすんな
>>871 帰りじゃなくて、いくんじゃないですかねえ?
なんだかやっぱ従来の手法だけでもあっさりAlphaZero超えられそうだな、 AlphaZeroもまだまだ伸びるんだろうが AlphaZeroってもしfloodgateに流すとしたら名前はどうなるんだろう、囲碁の場合はMasterって名前だった
評価関数と探索エンジンとの相性もあるのねえ ここにきてSM復権
クソブロガーもTwitterでそんなこといってたな 知の高速道路(笑)
棋士はAIが育てたそうです(笑) suimon@floodgate_fan 返信先: @IHayatoさん 将棋界も藤井聡太四段をはじめとして若手世代の台頭が目立ってきています。 AIの発達で勉強方法の知の高速道路が整ったからです。 彼らに負けないように最新技術を取り入れ頑張るしかないです。 午前7:02 · 2017年12月17日
大渋滞を抜けるにはどうするか? 車でなくリニアか飛行機を使えば良い。
将棋も囲碁も、結局はまるばつゲームなんだから 創造性なんてそのうちなくなるよね
>>887 菅井王位みたく将棋ソフトに頼り過ぎて一時的に弱くなったから手法を変えたみたいな方が健康的かなあって気が
勿論参考にはしているんだろうけど頭脳スポーツって部分が大きいだろうし
実際の対局で参考に出来る所と出来ない所の見極めが重要そうな気がする
やねうら王2017GOKU 《開発計画中》 もう2017年終わりそうやん(笑)
ここまで来たらいっそ2018で出そうってことだなきっと
[悲報]17gou公開が未定に [朗報]それより強いのが生まれた模様
普通にburn the bridgeの方が強いけどな
スパムモン(burn the bridge)はyaselmoの40Cなんだよなぁ・・・w なんでパクリ名前を平然と使えるのか偉そうなブログとポエム吐いても 社会人としての知識も教養も皆無 そもそもTwitter名も千田のパクリっしょwww
しかし人のパクって、ハイスペでfloodgateに流して何が楽しいのだろうか?
>>901 楽しいかどうかは置いておいて、見る方から言えばベンチマークになるだけ有難い
>>902 スパムモンよぅ・・・何のソフトかもスパックも記載せず
成績よかったら後出しジャンケンしてるのがベンチマークになる訳ないだろバカwww
>>902 yaselmo_40Cとか表記あればそうだろうけど、burn the bridgeだけじゃ観戦してる側は何も参考にならないよ
あとでyaselmoであることは言ってるし、もっとひどい名前で放流し続けているやついるだろ
Titanda_L=Yapata_Lってことでいいのかな?
ザ・お前が言うな suimon@floodgate_fan 最近のTwitter界隈は少し行き過ぎていて怖いです。 当事者に何も起きないことを願っています。 (将棋、将棋クラスタとは全く関係のない話です) 午後1:39 · 2017年12月18日
>>907 Yopitaも自己顕示欲ガイジだぞ
バグったレートでほくそ笑んでたけど
リセットされて上位と当たったら普通に負けてるw
レスの仕方を使い分けて精神を保とうとする安易な方法しかとれない悲しいガイジっすね
会社で褒められたことのない雑魚社会人は黙ってろよ どうせ何やらせても能力低いんだから ベンチマークこんな感じだろ? 社交性…0 事務処理能力…0 モテモテ度…童帝 卓球…3 2切れ…2300
スパムモン以外にfloodgateに粘着して変な棋譜上げるやつっているのかな?
>>892 とかどんだけ暇なの?って思う
そういえばスパムモンは月曜日は割りと変な時間帯にツイートしてるよな
あんちゃさんにTwitterでリプをスルーされた腹いせにレビュー書いたらしい。 特定班はよ。 suimon@floodgate_fan 返信先: @netatankさん ヨシダさんが書評をブログに書けば反響は大きいと思います(信者が恐いですが‥) 私もその本を買ったのですが、ヨシダさんと似たような感情を抱きました。 Amazonレビューの中のどれかは私が書きました。 午後6:56 · 2017年12月18日
SM1.25/Apery_sdt5* 4132 +16/-18 1422 YO4.79/Apery_sdt5* 4125 +12/-13 4423 やねうら王が優秀なのはelmoだけだった模様。
>>918 へーすごいじゃん。
suimonは一時期魔女信者だったからまたBuru_The_Blogを放流してくれるだろ。
だから前からstockfishをちまちまいじっているだけだと言ったじゃないか 探索部のチューニングは測定方法が確立していないから持ち時間や組み合わせる評価関数で随分と差があるということか 作るのにも測定するのにも莫大な計算資源が必要
学習部 aperyが優秀 探索部 いまだに魔女が優秀
魔女が優秀ってなら ネイティブでAperyの評価関数に対応した 新しい魔女が出てきたらそれで戦えるね
魔女が強いとは熱いなぁ suimonがまた魔女が好きだとか言い始めるに100万ペソかけてもいい
誰かこの日本語訳を頼む suimon@floodgate_fan まじっすかー。 半年後には探索ももっと強くなるんですかね…? suimonさんがリツイート k_ohga@k_ohga silent_majorityをclangでbuild。だいたい+R40くらい cmake使用、適当にapery_sdt5の評価関数形式を読める様にしてみたけど効果が見えなかったのでrevertした
>>918 魔女とYane4.79、うちのRyzenだと同じAVX2仕様でNPSが100万以上違うんだけど、Apery評価関数だと魔女が互角以上なのか凄いな。
WCSC27elmoの時点でも早指しや低スペックなら、 まだ魔女の方が強いかもみたいなことは言われてたからねえ
Qhapaq @Qhapaq_49 探索部はまだまだ強くなります。ソースはsdtの打ち上げでisseiさんが「君たち探索部最適化するの下手すぎだよw」と言ってたのを聞いた私。大きく出る時ほど何故か負けてしまうponanzaですが、今でもponaは最強のソフトだと思うし、強さに対して正直な所が私は好きでした。 イッセイ「弱いねぇ、君たち」
ponanzaはQhapaq+150位ってことか?
>>934 ディープラーニングなしでWCSC27から+20〜40、ディープラーニングありでさらに+150らしいからそれぐらいだろうな
ディープラーニング周りはイッセイさんじゃなくて大渡さんがいじってたんだけど
DLって、今のところ直接自己対戦と棋譜で強くなってるんだろうけど、 適当に作ったプログラムを対戦させてそのプログラムを強化していくってこともできるんだろうか 将棋そのものではなく将棋ソフトの開発を究めていくっていうような
AlphaZeroってのは繰り返し自己対戦でネットワークを鍛えていったんだと思うけど 全く同じ方法で三駒関係を鍛えた方が簡単に強いのが出来そうな気がするんだけど Googleはそれはやらなかったのかな やってみたけど三駒は既に限界まで強くなっていたとか?
目的がα0の汎用性を示すことなのにそんなことやるわけ無いだろ
まあGoogleは別にやらなくてもいいけど誰かそれで強くできないのかな
汎用性が具体的にどこまで効くかを見極めるという意義はあるだろう。 まぁ向こうからすればelmo超えたら十分だろうけど
とりあえずelmoに9割勝てるソフトが登場しないと話しにならない 挑戦権すらないという状況
やっぱ将棋って行き過ぎると 超天才A「7六歩」(脳内で激戦が繰り広げられる)超天才B「負けました」 とかになるのかな? [819818695]
http://2chb.net/r/poverty/1513605723/ >>943 Aを無謬の超天才と証明する術がBにない
Bにその自覚があるなら
>>943 の流れにはならない
魔女の設定のInc_MarginとMove_Overheadの値ってそれぞれどういう意味なの?
>938 三駒で学習というのは、将棋の知識を予め反映した状態でやると言うこと。 そういうの無しで、ルールだけ解れば後は勝手に強くなるというのが理想。
>>938 自己対戦の事を強化学習という。
いわゆるディープラーニングは評価関数を作るのに最適な特徴量抽出を
自動的にやってくれるのがウリなの。人間が恣意的に定めた3駒関係を
使って評価関数を作成するなんて事をしたら、DLの優位性が現れない。
何のためにAlphaシリーズをやってるのかわからん話になる。
DLが役にたつことを宣伝するために手法の選択肢は存在しないのだから、
欠点は大量のハードで補っている。
強化学習なんてのは昔からある手法。DQNはDeepなネットワーク使って
いたけど、3駒に十分な汎化性能があるんなら、その方が手っ取り早い。
ただ、それは、「単に強い将棋ソフトを作りたいだけのアマチュア」がトライ
すべき事。
適当に作ったプログラムを対戦させて強くなる、のと似たような手法に 遺伝的アルゴリズムってのがある。 複数作って対戦させて勝ったものと、親とのパラメータの掛け合わせをやって子を作って、 その子の中からまた勝ったものを親と掛け合わせて子をつくって、みたいなのを延々とやる方法。 突然変異とかも設定できるらしいから面白そうだよ。
Qhapaq? @Qhapaq_49 sdtでponanzaと当たる際に「レートどのぐらいです?」と問われたので 「elmo+160-180ぐらいかと」と答えたら「うーん、それならそっち勝率3割くらいかな」 と返されたのはいい思い出です。最後まで勝てなかったのは悔しいですが、 存在を意識してもらえる域までは辿りつけたのだなあと。 uuunさんとこより YO4.53/elmo-wcsc27 3939 YO4.79/Qhapaq_sdt5 4069(+130) だから、推定でponanza_SDT5は4210〜4220ってとこか。 aperypaqでもちょっと届いていないんだな。
今更だけどsdtに関しては事前定跡が有利すぎるのは当然だよなぁ 欠陥ルールもいいとこやね
別にどうでもいいじゃんw floodgateでBurn_The_Bridgeとか寒い名前で流すよりマシだよ
silent majorityのエンジン設定わかる人いませんか? move_overheadがデフォルトで30なんですけど、なんの設定なんでしょうか。
>>953 通信対戦時の通信遅延対策の設定じゃないの?
知らんけど。
コンピュータ将棋の形として、評価関数+探索がメインという設計の形ってのはいろいろあるなかでのひとつでしかない。 別に定跡データベースをメインとして、補助的に評価関数+探索という設計も普通にあるんじゃないかな。 ただ、今まで将棋では誰もそういう設計をしてこなかっただけで、オセロではそっちのほうがメインストリームらしいじゃないか。 いろんな種類のソフトがあってこその発展があるんだよ。 みんながやねうら王の改造だけしてるよりかよっぽどまし。
>>954 30msだとすると流石に遅延に大して値が小さすぎる気がしないでもないです。
>>955 凄い発想だな!
出来るまでROMってろ
魔女の設定の質問してるのどうせひまわりくんだろ 開発してないから分からないんだよな
>>958 ひまわりくん?ではないですけど、設定についてご存じでしたら教えて頂きたいです。
>>956 ローカルのプロセス間通信ならそんなもんやん
>>961 なるほど、ローカルで実際に指し手が指されるまでの遅延対策ということですか、ありがとうございます。
せっかくだからやねうらおのstockfish解析記事とgitの解説txtを読んでみたまえ
>>963 いや、知らんけど。
2000に設定して持ち時間なし、一手10秒で8秒で指すかみてみんと。
>>948 自己対戦と強化学習は違う
強化学習は過去の経緯を元により高い対価を選択するようにする方法。
その経緯とは、別に自己対局の経験からでは無くてもよいので
自己対戦と強化学習とは本質的な意味合いが違う
もうちょっと勉強しろ
ifdef.hpp の #define RESIGN を有効にして、ビルドすれば設定できるようになる
やっぱりエンジン設定の分かりやすいやねうら王がナンバーワンや!
そういえば最近スマホのCPU性能と将棋ソフトの話もご無沙汰だったけど、 iphone8とiphoneXのCPU性能がHuaweiのPやMateシリーズよりも1.7倍とかになってるのな。 やっぱりshogidroidのiOS版があるとずいぶん違ってきそう。
事務処理能力が低すぎて社会人になって褒められない雑魚社会人
>>971 スマホ触ってるときくらい将棋休んだら?
まじで将棋以外にすることのない○○○○じゃん
iPhoneの俺はshogidroidのために家用、職場用、車用、予備のAndroid端末買ったぞ そして時計もAndroid
最新aperypaq>>>電王ponpoko>>>引退ponanza
Burn_The_Bridge>>>>>>開発者のウンコパソコン>>>>>>養分雑魚読者
なんでこれリツイートしたんだ? 童帝なの? suimonさんがリツイート はあちゅう@ha_chu 童貞(童貞的思考、なども含む)が大好きすぎて、こんなにも「言われて嫌だ」と思う人がいると全く思わなかったのですが、皆様からの指摘を受けて反省したので謝罪させていただきます。 過去の「童貞」に関する発言についてのお詫び|はあちゅう|note(ノート)
>>948 単に強い将棋ソフトが作りたいだけのアマチュアがやればいいのはそうだけど、
比較してDLのほうが優秀であることを示すためにも「人間が恣意的に定めた3駒関係を
使って評価関数を作成する」というのは有効じゃなかろうか
まぁ3駒のほうが優秀な気がするし、そういう結果が出たら公表しないだろうなと言う気もする
NVIDIAが規約変更によりGeForceのデータセンター利用を制限。大学などの研究活動にも大ブレーキ
WirelessWire News(ワイヤレスワイヤーニュース) (
https://wirelesswire.jp/2017/12/62658/ )
というかDeepMindって3駒関係とか知ってるんだろうか、stockfishについてはたまに呟いてるようだけど コンピュータ将棋の話は聞かん
3駒のほうが優秀だったらどっかの層で拾ってるはずか。一つのことに集中させるのと 手広く学習させるのどっちが効率がいいかという問題か
次スレは130? いつも通りワッチョイあり IPなしになるのかな
3駒、4駒のほうが劣ってるのは確実だとおもっているが。 ディープラーニングの仕方じたいがよくわかってないが、 学習してる最中では3駒、4駒に近い評価もしていて、それを超える評価ができてるから負けるんだろ。
>>986 IPありにしようぜ
ひまわりが静かになって開発者に有益
藤井総太がApery wcsc25と互角ってことは、レートで3100くらいあったって事だよな そうするとトップはプラス200くらいか? ってことは、ソフトがトッププロ超えたのって割りと最近なんじゃね?
今夜のNHK特番見た ポナンザ開発者の山本ってやつ礼節なってなさすぎだろ
少し前までは盛り上げるための演技かな?と思われていたが…
一概に優劣を決めない方針で言わせてもらえば、子供のころは学習能力が高くて幅広く いろんなことを学習することができる、そのかわり自分が無くて流されやすいといいうデメリットが伴う 大人になって学習能力が落ちていくと、方法をしぼって限られた能力で効率よく学習しようとする、 そのかわり偏見を脱しにくいというデメリットが伴う 前者がDLで後者が3駒ってイメージ
>>990 んだてめー
下級戦士がエリートに口出すんじゃねえ
-curl lud20250210060811caこのスレへの固定リンク: http://5chb.net/r/bgame/1512031248/ ヒント: 5chスレのurlに http ://xxxx.5chb .net/xxxx のようにb を入れるだけでここでスレ保存、閲覧できます。TOPへ TOPへ
全掲示板一覧 この掲示板へ 人気スレ |
>50
>100
>200
>300
>500
>1000枚
新着画像 ↓「▲コンピュータ将棋スレッド128 YouTube動画>1本 ->画像>35枚 」 を見た人も見ています:・コンピュータ将棋スレッド 148 ・コンピュータ将棋スレッド 182 ・コンピュータ将棋スレッド 175 ・▲コンピュータ将棋スレッド125 ・▲コンピュータ将棋スレッド126 ・コンピュータ将棋スレッド155 ・コンピュータ将棋スレッド 176 ・コンピュータ将棋スレッド 160 ・コンピュータ将棋スレッド 147 ・コンピュータ将棋スレッド 173 ・コンピュータ将棋スレッド 181 ・▲コンピュータ将棋スレッド138 ・コンピュータ将棋スレッド 183 ・▲コンピュータ将棋スレッド130 ・▲コンピュータ将棋スレッド122 ・コンピュータ将棋スレッド 170 ・コンピュータ将棋スレッド190 ・コンピュータ将棋スレッド 169 ・コンピュータ将棋スレッド 172 ・▲コンピュータ将棋スレッド111▽ ・コンピュータ将棋スレッド 166 ・▲コンピュータ将棋スレッド110▽IP無し ・コンピュータ将棋スレッド 147 ・▲コンピュータ将棋スレッド95▽ ・コンピュータ将棋スレッド 169 ・▲コンピュータ将棋スレッド127 ・コンピュータ将棋スレッド 148 ・コンピュータ将棋スレッド 177 ・コンピュータ将棋スレッド 168 ・コンピュータ将棋スレッド189 ・コンピュータ将棋スレッド 162 ・コンピュータ将棋スレッド 163 ・コンピュータ将棋スレッド 164 ・▲コンピュータ将棋スレッド117 ・コンピュータ将棋スレッド 153 ・コンピュータ将棋スレッド 151 ・▲コンピュータ将棋スレッド136 ・コンピュータ将棋スレッド142 ・▲コンピュータ将棋スレッド107▽ ・▲コンピュータ将棋スレッド106▽ ・コンピュータ将棋スレッド 157 ・コンピュータ将棋スレッド156 ・コンピューター将棋、5年間でレーティング1533向上 ・【suimon】コンピュータ将棋ブログスレ★2 ・コンピュータ将棋スレワッチョイなし (209) ・将棋ウォーズグランドチャンピオンシップ総合スレ ・第29回世界コンピュータ将棋選手権 ・コンピュータ将棋ソフトの特徴を論じよう! ・第29回世界コンピュータ将棋選手権 2 ・[速報]『コンピューター将棋史の20人』 発表される ・ドラゴンボール風に将棋を語るスレ ・第28回世界コンピュータ将棋選手権 ・第26回世界コンピュータ将棋選手権 第2局 ・世界コンピュータ将棋選手権 電竜戦 4 ・コンピュータ将棋におけるTAKESHIって知ってる? ・アベマ将棋コメント欄 NGワード設定「拡張機能」でスッキリ解決 ・初心者が3日でネット将棋デビューするスレ 14 ・将棋ウォーズの棋神もらえるタイミングを研究スレ ・【将棋世界】永瀬九段インタビュー ASDを告白 ・将棋ウォーズで負けるとストレスマッハ ・[ID無] ミクサー将棋の評価値 実況生中継スレッド ・将棋界のファッションリーダー佐藤天彦さん応援スレ ・【大統領選】米保守系テレビ FOXニュース 「ドミニオン投票機による不正」陰謀論を垂れ流し、ドミニオン社に訴えられピンチへ [ramune★] ・【DQMSL】ドラゴンクエストモンスターズスーパーライト非課金スレpart2857【コテ・顔文字・課金・ノゴロー禁止】 ・【サッカー】<パチューカ本田スタメン!>南米王者から得点なるか…グレミオ戦も先発、25時39分から日本テレビ系列にて放送
06:52:44 up 31 days, 7:56, 3 users, load average: 62.20, 72.11, 72.82
in 0.10484600067139 sec
@0.10484600067139@0b7 on 021320