55 条留言
显示不了符号,柯尔莫哥洛夫定义是用集合符号定义的。勒贝格测度也是集合符号,没法显示。
2015-12-28 21:56:08 回复
更想知道蒙特卡罗,马尔科夫过程.....
马尔科夫过程在豆瓣写不了,因为豆瓣不支持符号。想介绍马尔科夫过程的核心思想,必须介绍布朗运动,维纳分布,郎之万方程和时间对称等等概念,这些玩意没数学公式,光凭口水话,我觉得写的人都看不懂。
2015-12-26 17:38:29 回复
longshen
2015-12-25 14:33:17
个人认为,时间序列比贝叶斯用起来更方便些。
时间序列只包括系统的历史信息,不包括观察者的先验信息,所以只能预测系统惯性,对系统突变无能为力,但是贝叶斯方法由于包括了观测者的先验信息,能够处理突变问题。这种例子很多。在一个非线性系统处于不稳定环境中时,贝叶斯方法的效果好于时间序列。股市就可以证明这点。
2015-12-26 17:44:22 回复
一休哥们儿
2015-12-25 14:34:00
请教忙总,如果基于样本和经验得到了一定的概率分布,但由于不确定性,仍不能确保决策正确,这时做决策时如何对风险和不确定性进行管理,有没有相关的框架可遵循。
所以贝叶斯方法引入了似然·极大似然方法。其实在前面介绍中有:多检测,会诊。
2015-12-26 17:45:37 回复
我自欲为懵懂客
2015-12-25 17:02:14
文科生完全看不懂.....?所以直接看结论。经验累积足以让一些反应成为本能,这些本能将有助于躲避危险和把握机遇。年轻人阅历少没有获取直接经验的机会,可行办法就是读历史读案例做情景模拟模拟代入前人角色汲取间接经验。不知道这个思路对不对?
不是这样的,贝叶斯是一种归纳推理算法:也即推理的步骤。不是一些单纯概念。现在垃圾邮件拦截,网络搜索(例如Google),机器翻译等等都是贝叶斯方法。贝叶斯方法是硬技术,相当于车床,冲床,不是随便说说的东西。
2015-12-26 17:47:51 回复
jianduanle
2015-12-25 17:59:00
如果应用到工作中,就是说面对一个问题的时候,掌握的信息越多,越逼近事情的真相和问题的根源。
我在工作中,遇到复杂问题时,一般的工作方法是尽可能多的了解相关的情况,先摸清体系,然后再梳理问题并考虑解决方案。
一些年轻人习惯犯的方法有两种:一是上来就按照自己的直觉去干,生怕问题处理的不够快;二是只关注问题本身,只关注问题是否解决,不愿意或没想到去了解体系。
贝叶斯给出的计算方法比概念重要,不但告诉你干什么,也告诉你怎么干。这点与传统社会科学不同,社会科学不会告诉你怎么干。
2015-12-26 17:49:10 回复
忙总何不谈一下“概率应用的陷阱”
概率讨论稍微深入一点,就得讨论勒贝格测度,不然进行不下去。我没勇气在这里讨论,这玩意需要的预备知识太多了。当年科大上了一学期课,讲了26个引理,才算引导到可以开始讨论阶段。
2015-12-26 17:51:30 回复
大赞芒总,写代码应用过贝叶斯。期待芒总有空时能再来一篇普及下马尔可夫过程
马尔科夫过程解释得最好的一本书是是钟开来的名著《马尔科夫过程,布朗运动和时间对称》,建议有兴趣看看,豆瓣没法科普,因为没有办法展示数学符号。没数学符号,解释不了转移矩阵这些最简单概念。
2015-12-26 17:42:04 回复
请教芒总可能不相关的问题,研究广义相对论中有个叫因果的律理论,从贝叶斯理论能否推导因果律的正确否?
量子力学其实推翻了严格的因果关系。所以基于世界本质是随机假设的贝叶斯理论,也推翻了严格因果关系的存在,认为事物之间因果关系只存在于概率分布意义下,与量子力学差不多。
2015-12-26 17:40:19 回复
唉,测度论我也学不下去。看过两本教材,一本是俄罗斯的那汤松《实变函数》,读完第三章可测集就不想读下去了。 第二本是夏道行的,提到环的概念也没看懂,为此买了本拓扑学,最后是不了了之了。忙总觉得怎样的学习顺序会更好呢?有没有更通俗点的教材
不是特别喜欢数学,不建议自学数学,浪费时间,因为歧路太多,容易迷路。
2015-12-27 16:02:35 回复
xienan
2015-12-26 19:47:39
忙总,大数据分析关注事件之间的相关性,而不关注因果性;量子力学中用概率解释代替因果解释。这二者之间是否有某种联系?
量子力学其实不完全是推翻微观世界因果性这么简单,因为波恩的概率解释、海森堡的不确定性原理和玻尔的互补原理是完整理解量子力学的基础,简单来讲,前两者摧毁了经典世界的(严格)因果性,互补原理和不确定原理又合力捣毁了世界的(绝对)客观性。建议看看《量子论的哥本哈根解释》。
2015-12-27 16:01:01 回复
这就是社会科学最软肋的地方,不知道怎么干。我个人理解是社会科学无法定量分析,没法精确计算给出路径。很多社会科学家以为弄条粗糙的公式就是定量分析。芒总,您觉得社会学、法学这些什么领域能够用到比较好的数学理论?博弈论?还是控制论?
社会科学未来的前途我觉得不是使用定量工具。使用定量工具,无论如何比不过自然科学,他们需要的是思想的穿透力,洞察力,判断力,例如《易经》就没有什么数量工具概念,《黄帝内经》也没有,但是能够屹立几千年不倒。现在这些社会科学家自己无能,思想没有穿透力,洞察力,判断力,只好往数量工具上靠,试图换点饭吃,就像走江湖的用《易经》的术数算命混饭吃一样,是走到邪路上去了。
2015-12-27 15:52:51 回复
忙总,请教您一个问题,不知道您是否了解现在的一种叫做“全脑教育(全脑思维课程)”,下午参加了一次这样的课程,里面的小孩子展现的蒙眼识字、快速作诗,快速记忆等一系列神奇能力,这种培训可信吗?
不了解,我觉得现在骗子太多,傻子都不够用了。智力开发不是这种以培养巫婆神汉为目标的模式。
2015-12-28 11:41:11 回复
xienan
2015-12-28 07:35:35
我本人是赞同哥本哈根学派的。个人感觉,因果性和时间的连续性,是人类的某种错觉。或者说是在人类认知尺度上,对真实世界的一种近似。建立保罗万象的大一统理论是件遥不可及的事。
这个不懂,尤其是弦论。不过我的同班同学,既有弦论大师,也有反对弦论的,认为他们走到邪路上去了,都是一流大学的一流教授,所以不知道谁对。
2015-12-28 11:34:15 回复
Cousteau
2015-12-28 20:47:35
公式符号一般是用“公式编辑器”做好再截图发到网上的。不清楚网友们怎么直接过度到马尔科夫过程了,忙总如果有暇有意,可以简单介绍下lebesgue测度和kolmogorov给概率论做的公理化基础。
柯尔莫果洛夫概率论公理
假设我们有一个基础集Ω,其子集Χ为σ代数,和一个给Χ的要素指定一个实数的函数P。Χ的要素是Ω的子集,称为“事件”。
设Ω为非空集合。满足以下条件的集合系Χ称为Ω上的一个σ代数:
Ω在Χ中;
如果一个集合A在Χ中,那么它的补集-A也在Χ中;
如果有若干个(甚至可数个)集合A1,A2,.....An都在Χ中,那么它们的并集也在Χ中。
也即设Ω为非空集合。则Ω上的一个σ代数是指一个关于可数并集运算封闭的集合代数。
记号(Ω,Χ)称为一个可测空间。所以测度论和勒贝格积分的所有定理都能自然使用。
对于确定的σ代数Χ,Ω的子集中属于Χ的称为可测集合。而在概率论中,这些集合被称为随机事件。
某个集合X上的σ代数又叫σ域,是X的所有子集的集合(也就是幂集)的一个子集。这个子集满足对于可数个集合的并集运算和补集运算的封闭性(因此对于交集运算也是封闭的)。σ代数可以用来严格地定义所谓的“可测集合”,是测度论的基础概念之一。
第一公理
对于任意一个集合E∈Χ, 即对于任意的事件P(E)∈[0,1]。
即,任一事件的概率都可以用0到1区间上的一个实数来表示。
第二公理
P(Ω)=1。
即,整体样本集合中的某个基本事件发生的概率为1。也即在样本集合之外已经不存在基本事件了。
第三公理
任意两两不相交事件E1,E2....的可数序列满足P(E1UE2U......)=ΣP(Ei)。
即,不相交子集的并的事件集合的概率为那些子集的概率的和。这也被称为是σ可加性。如果存在子集间的重叠,这一关系不成立。
2015-12-28 22:32:25 回复
wxmang
2015-12-28 22:32:25
柯尔莫果洛夫概率论公理
假设我们有一个基础集Ω,其子集Χ为σ代数,和一个给Χ的要素指定一个实数的函数P。Χ的要素是Ω的子集,称为“事件”。
设Ω为非空集合。满足以下条件的集合系Χ称为Ω上的一个σ代数:
Ω在Χ中;
如果一个集合A在Χ中,那么它的补集-A也在Χ中;
如果有若干个(甚至可数个)集合A1,A2,.....An都在Χ中,那么它们的并集也在Χ中。
也即设Ω为非空集合。则Ω上的一个σ代数是指一个关于可数并集运算封闭的集合代数。
记号(Ω,Χ)称为一个可测空间。所以测度论和勒贝格积分的所有定理都能自然使用。
对于确定的σ代数Χ,Ω的子集中属于Χ的称为可测集合。而在概率论中,这些集合被称为随机事件。
某个集合X上的σ代数又叫σ域,是X的所有子集的集合(也就是幂集)的一个子集。这个子集满足对于可数个集合的并集运算和补集运算的封闭性(因此对于交集运算也是封闭的)。σ代数可以用来严格地定义所谓的“可测集合”,是测度论的基础概念之一。
第一公理
对于任意一个集合E∈Χ, 即对于任意的事件P(E)∈[0,1]。
即,任一事件的概率都可以用0到1区间上的一个实数来表示。
第二公理
P(Ω)=1。
即,整体样本集合中的某个基本事件发生的概率为1。也即在样本集合之外已经不存在基本事件了。
第三公理
任意两两不相交事件E1,E2....的可数序列满足P(E1UE2U......)=ΣP(Ei)。
即,不相交子集的并的事件集合的概率为那些子集的概率的和。这也被称为是σ可加性。如果存在子集间的重叠,这一关系不成立。
某个事件E的概率P(E)定义在所有可能基础事件的样本空间Ω时,概率P必须满足柯尔莫果洛夫公理。
也即概率就是定义在样本空间的子集的σ代数上的一个测度,那些子集为事件,使得所有集的测度为1。
2015-12-28 22:37:40 回复
请教,本忙总文中写的现代统计学两大支柱,是不是指:贝叶斯理论和显著性检验。分别对应贝叶斯派和频率派,两派一直纠缠不清。我见到的多数大学教材都是采用频率派的理论框架,夹杂者贝叶斯派的知识。我的理解两派争论的原因是决策者和决策对象,主观和客观的矛盾。
是的,这个问题实际上在柯尔莫哥洛夫用公理化定义概率就出现了,概念其实只在实践中有用,因为他基本只能处理离散事件,连续性的问题,频率派处理不了。而最优控制里面的随机问题,都是连续性的。
现在大学教科书大多用频率派的框架,是因为简单,不需要太多数学,例如不需要懂实变函数,泛函分析。
其实高级的概率论问题,频率派无法解决,甚至根本看不懂。至于高等数理统计,例如陈希瑞先生写的,就与频率派无关了。其实钟开来写的数理统计,也与频率派无关。
2016-01-20 11:59:00 回复
实话实说,我其实也有点蒙圈,也是一家之言,陈希孺先生其实也是蒙圈的,当年在科大上课时,对这个问题也是说不清道不明的(可以参考他写的:《数理统计学简史》,2002年,湖南教育出版社),陈先生算是中国数理统计学界的泰斗了。所以说这个问题各有各的说法,数学家说数学家的观点,统计学家说统计学家的观点,谁对谁错其实无所谓,只要解决问题就行。就现在企业质量控制、风险管理和设计等等实用场合,主要还是贝叶斯方法多,fisher的方法在保险或医药行业用的多。
我觉得该用什么用什么吧。
2016-01-20 13:35:24 回复
该用什么用什么,很赞同。春节假期看看陈先生的讲解。
我体会陈先生在贝叶斯和频率派上采取中立态度(他其实是Fisher和Neyman的粉丝,他在波兰学习过),是因为他以前的世界观是确定性的,不能接受贝叶斯学派的世界是随机的观点。可是随着量子力学和复杂系统的发展,似乎世界的确是不确定性的,甚至复杂非线性系统里面严格的因果关系是不成立的,所以他又觉得贝叶斯不是一无可取。在他的书里,仍然是确定性的粉丝,不过比较中立和客观了。
2016-01-20 14:39:07 回复
Cousteau
2016-01-20 21:07:24
贝叶斯理论的个人理解:研究对象的样本数不确定是有限还是无限的,而没有无限概念,就没有“连续性”和分析概念。您说的确定性,是否一般是指集合能够被准确定义,至少要求对任意一个元素都能够确切判断其是否属于此集合?对于大样本有限集合,其计算结果和无限样本的结果肯定不同,虽然集合乍看起来差不多。针对一个不确定是否有限的集合的定义,既不能一一列出,也不能用公式表述,只能描述其部分特性。贝叶斯的“理性”一部分就是它不预先假设研究对象是确切的,无限的,也就不假设其分布符合分析结果,但是依然保留“部分特性”。在结果预测时就会在确定频率的基础上考虑具体的因素,得出更具有针对性的结果。请指正
不是你理解的,这个问题讲清楚,需要很多篇幅,或者你去看陈希孺先生的《数理统计简史》,或者等我有时间,慢慢整理。因为在数理统计诸多分支中,情况看不完全相同。
1950年前,数理统计学派是英国学派占主流,也即Fisher为代表这一派,他们特点是:坚定反对贝叶斯(因为他们是确定论世界观),反对Neyman为代表的数学化(当年Neyman就是因为看不惯英国学派的数学基础太差,民科水平才去的伯克利,结果通过严格数学化数理统计的基础,把伯克利建立成为世界数理统计重镇和核心),他们强调实用,应用。,初等化,平民化,工具化,总之,就是数理统计是傻瓜工具,没有什么逻辑基础(不考虑,当年Neyman写的一篇置信区间严格定义的论文,被Fisher拒绝发表,但是这篇论文奠定了现代数理统计的逻辑基础)。
所以我觉得讨论数理统计的基础,得从Neyman的工作及其以后数理统计的发展开始,Fisher的东西在我看来太不严谨,基本是民科的水平(能够用,但是严格追究概念和逻辑,就要抓瞎,因为他经常武断的给出一个东西,至于为什么,有什么逻辑基础,不知道)。
这一部分工作,得看钟开来的书。需要很多时间。我暂时还没大块时间来整理,当年看过钟开来的书,也忘得差不多了。
最糟糕是豆瓣不能展示数学公式。
2016-01-21 13:25:51 回复
wxmang
2016-01-21 13:25:51
不是你理解的,这个问题讲清楚,需要很多篇幅,或者你去看陈希孺先生的《数理统计简史》,或者等我有时间,慢慢整理。因为在数理统计诸多分支中,情况看不完全相同。
1950年前,数理统计学派是英国学派占主流,也即Fisher为代表这一派,他们特点是:坚定反对贝叶斯(因为他们是确定论世界观),反对Neyman为代表的数学化(当年Neyman就是因为看不惯英国学派的数学基础太差,民科水平才去的伯克利,结果通过严格数学化数理统计的基础,把伯克利建立成为世界数理统计重镇和核心),他们强调实用,应用。,初等化,平民化,工具化,总之,就是数理统计是傻瓜工具,没有什么逻辑基础(不考虑,当年Neyman写的一篇置信区间严格定义的论文,被Fisher拒绝发表,但是这篇论文奠定了现代数理统计的逻辑基础)。
所以我觉得讨论数理统计的基础,得从Neyman的工作及其以后数理统计的发展开始,Fisher的东西在我看来太不严谨,基本是民科的水平(能够用,但是严格追究概念和逻辑,就要抓瞎,因为他经常武断的给出一个东西,至于为什么,有什么逻辑基础,不知道)。
这一部分工作,得看钟开来的书。需要很多时间。我暂时还没大块时间来整理,当年看过钟开来的书,也忘得差不多了。
最糟糕是豆瓣不能展示数学公式。
钟开莱的名言:我最讨厌统计学家。
我想他的理解是:统计学就是民科吧。
2016-01-21 18:12:05 回复
很像,波粒二象性和测不准原理
与那个还真无关,就是一个对世界看法的问题。
2016-01-21 13:38:37 回复
wxmang
2016-01-21 18:12:05
钟开莱的名言:我最讨厌统计学家。
我想他的理解是:统计学就是民科吧。
继续瞎扯。
数理统计频率学派的数学基础是概率论的大数定理和中心极限定理,如果没有这个基础,直接就是民科裸奔(这可能就是钟开莱先生讨厌统计学家的原因,因为他们学科的基础太脆弱了)。这两类定理在柯尔莫哥洛夫公理化定义的概率前提下,是可以严格证明的,也即逻辑上没有漏洞。不过建立这个基础的工作不是坚定的反贝叶斯学派的Fisher完成的,而是Neyman。
不过算是这样,数理统计的数学基础仍然很不完善,经常还是要加入人为因素才能处理问题,就不说贝叶斯学派的先验概率逻辑漏洞了:因为无法进行精确定义和度量,就算是频率学派的极大似然函数也要考人的经验参与,甚至数理统计的数学建模,都需要经验,这时经验其实跟算命的作用差不多--瞎蒙而已,因为经验并不能对从未见过或发生过的事情起作用,而数理统计建模,却经常要这样做。
Neyman曾师从于波兰谢尔品斯基等数学家,是假设检验的统计理论的创始人之一。他与K·皮尔逊的儿子E·S·皮尔逊合著《统计假设试验理论》,发展了假设检验的数学理论,把假设检验问题简化为一个最优化问题来处理,引进了检验功效函数的概念,以此作为判断检验程序好坏的标准,这种思想使统计推断理论变得非常明确。
当时英国数理统计学派(以Fisher为主要代表)主流观点是:统计应该是为人民大众服务的通俗易懂的工具。而Neyman则认为纯数学应作为统计学理论基础,强调数学上的严格和美。Neyman的一篇长篇论文《基于经典概率论的统计估计理论纲要》,寄小皮尔森主编的《生物计量》,小皮尔森拒绝采用,寄给Fisher控制的刊物,也被拒绝。这时世界数理统计学界的主要刊物都被小皮尔森(接替其父亲老皮尔森)和Fisher控制。Neyman最后只能依靠Fisher的敌人,当时的贝叶斯学派领袖推荐,才终于得以在《皇家学会哲学会报》发表。
所以当时就爆发了Neyman不满Fisher和皮尔森父子数学上的低能,认为搞的统计学没有数学基础支撑,纯属民科级别的冲突。所以当 Neyman 接到伯克利数学系主任Evans邀请后,就去了美国,成立了统计学界著名的伯克利统计实验室(我国的许宝禄先生也出身于这个实验室)。Evans当时想法是“找一个个性极强的中心人物来建立一个理论统计学学派”。二十年后,伯克利彻底取代了伦敦大学独霸世界统计学界龙头几十年的地位。
从学派的分歧来看,英国数理统计学派的传统观点是统计学要面向实际通俗易操作,能为实际工作者直接使用,所以Fisher相信直觉(Fisher认为当N=1,2,3如果都成立的话应该就没问题了)。
而Neyman一直想为数理统计建立严格的数学基础,在Neyman领导下,统计学主流成为注重数学上的严密性,形式简洁但理论深奥。而且Neyman认为当时Fisher面临的问题是:从实际问题出发研究通用方法已经走投无路。
伯克利的J. W. Tukey 于1962年发表了《数据分析的未来》,基本代表了美国现代数理统计学派的主要思想:
1、任何学科想发展,都应当寻求全新的问题来研究;
2、应当在更现实的框架下去研究老问题;
3、不要为了因为数学能力不足而采用过于简化的模型或者以及与现实不符的假定;
4、应当寻求新的处理观测数据的方法,弄清楚其有用的性质,以备选用(不要老是均值方差这一套);
5、不要给定参数的概率模型后去做参数估计,数据分析应该在确定概率模型前(也即不要先确定结论,再去找原因。频率学派的数理统计方法实际上能够做到:对任何给定的结果,找到对应的原因。基本属于马屁专业学科,只是批一个数学马甲);
6、数据分析必须容许适当程度的错误,以使所获的不周全的证据可以经常启示一个正确的解法;
7、勿本末倒置,数据分析使用数学论证和结果,是以此作为一种根据,而非用于证明或方法合法性的印记;
8、如果只是在新增因素的基础上进行解的优化,就不必了;
9、多用简单的、易行易懂的方法;
10、稳健性重于有效性;
11、数理统计的重点是数据分析,是data investigation, 而不是传统的数据处理。数理统计必须强调人的判断的重要性,对分析结果的解释采取不盲从而是有批判性的立场。
也即Tukey把数理统计学工作分为两类,一类是对数据分析有贡献的(而英国传统频率学派,大多数时候仅仅是数据处理而不是数据分析),另一类是纯数学工作。任何一件数理统计学工作必须从实用或纯数学中选其一,否则就毫无价值。
陈希孺先生认为:统计学不只是一种方法或技术,还含有世界观的成分——它是看待世界上万事万物的一种方法,我们常讲某事从统计观点看如何如何,指的就是这个意思。
同时,陈先生还认为,自从柯尔莫哥洛夫定义了概率论的公理体系,人们就可以抛开“概率究竟是什么”的问题,专注于概率在推理运算中该如何使用。
2016-01-21 19:44:56 回复
忙总,这么描述不确定性可以吗:量子力学和系统学所掌握的关于对象系统的规律是一种统计规律。
有两种可能的解释:1它们的参数和物理量本来是确定的,只是目前人们只掌握到统计规律的层次;2它们的参数和物理量根本没有确切值,按统计规律来取值是其根本特点。虽然不清楚不确定性的来源,但其统计规律本身是确定无疑的。
随机事件和不确定性事件是根本不同的。随机事件可以通过无限抽样逐步逼近了解其分布(大数定理),也即局部信息包含整体信息。而不确定性事件不能通过抽样确定分布,甚至可能根本没有稳定的分布,也即不确定事件是没法通过抽样把握规律的,也即局部信息并不包含整体信息。
概率论只研究随机事件。
在复杂系统中,相当多类型的湍流,混沌等等都是不确定性事件,无法用概率分布描述。
2016-01-21 20:01:59 回复
Cousteau
2016-01-21 21:12:34
谢谢,我没认真看过数理统计,有空一定补上。当初看的是王竹溪的热力学与统计力学的几本书,当时还是被王先生本身叙述的优美吸引的。不过我的一个主要问题就是您后来说的世界观上面的,就是您如何区分无限集合和较大有限集合呢?
可穷举的就是有限的,不可穷举的,就是无限的,例如对任意N,总存在N+1,就是无限的。
2016-01-22 10:58:43 回复
继续延伸乱推论一下,以双盲实验为依据的西药学……属于这个范畴否?
是的,这个双盲实验的科学性争论极大,我有一个同学在美国大医药公司负责设计新药的双盲实验方案,去年大半年,我们同班的同学争论他的工作是否科学还是蒙人,很多争论的都是数理统计教授,还有的是国际数理统计界的大腕。
争论半天,公说公有理,我也没看出谁对谁错,不过倒是知道了双盲试验可能存在逻辑漏洞:因为未了实验可行和降低成本,必须对实验模型的因素和变量进行删减,而删谁不删谁,全看经验和已经知道的知识,而新药往往没有经验,也没有知识储备,这时删除,就是靠蒙或赌,也即可能删除的恰好是最关键的因素。
所以说双盲实验就绝对科学,我觉得纯属扯淡。
2016-01-22 10:47:55 回复
这个系列帖子很费精力和心力,我想这是您对研究生阶段及之前所学的一个回顾,当然加入了工作近30年的经验。
机器学习对未来几十年的各类决策辅助,应该影响很大。归纳推理逻辑将走入一个前所未有的顶峰。
目前机器学习核心就是贝叶斯决断。基本独霸天下了。google的搜索算法,在线翻译,都是贝叶斯决断。
2016-01-22 10:42:19 回复
忙总,那段是参考喀兴林先生的表达。他的思想是和稀泥。虽然深一层次的规律争论不休,但是避开这些问题,但是把建立一个唯象公理化的理论体系是可能的和恰当的。以后不论那种意见被证明是正确的,其公理化结构不会重大改变。当然我也蒙圈,工作中只是用到一些相关结论,目前涉及不到原理层次。上述表达是个人理解,肯定与喀先生的有误差。
这其实是一个哲学问题。我们知道哥德尔不完备定理,稍微推广一下,我们知道就知道一般公理系统都是不完备的,也即总有在公理系统以外的概念或事物,而公理系统定义的原则,就是我们认识的边界。根据这个原则,柯尔莫哥洛夫定义的概率公理系统可能也是不完备的,所以根据他的定义得到的结论,可能也是不完备的。
根据柯尔莫哥洛夫公理系统对概率的定义,我们知道实际上随机事件组成的集合是一个勒贝格可测集,概率实际上是一个勒贝格可积函数。由于存在勒贝格不可测集合和勒贝格不可积函数,也即从逻辑上讲,存在不可通过局部信息了解全局信息的事件。
所以严格讲,有限的知识,总是有边界的,可是边界外面是什么?目前我们从逻辑上讲就无法知道。
2016-01-22 10:38:34 回复
deepVar
2016-01-22 10:28:33
现在伯克利也是计算机尤其是机器学习的顶级强校之一,有机器学习界的领袖级科学家迈克尔.乔丹。
其实我觉得机器学习和统计几乎合流。
开句玩笑,忙总如果是这十年的学统计出身的话,弄不好也去美帝搞机器学习了。对现在的学生吸引力太大。估计忙总同学也有不少人在这个圈子。
的确,现在机器学习基本就是贝叶斯学派的天下。
不过我的同学搞这玩意不多,因为他们基本是反贝叶斯学派的,还是搞传统的假设检验,方差分析,回归分析的比较多,只有很少在搞参数估计(因为这是贝叶斯方法的强项,他们玩不过)。
我如果继续搞数理统计,我会搞回归分析,这是当时热门:预测学的基础。
2016-01-22 10:41:19 回复
好奇地问一句,是因为师门的缘故么?老师少搞或不搞贝叶斯?
是的,当时国内没人搞贝叶斯,因为在文革时,贝叶斯被批判为资产阶级唯心论(同时倍批判的还有量子力学和相对论,如果能够找到当年工人批判组的文章,才会笑掉大牙)。所以大学里面禁止搞。
2016-01-22 11:47:29 回复
Cousteau
2016-01-22 18:23:05
可是现实中不能按穷举法判别...比如海里有多少条鱼,对于不同组织来说就不一样
数学理解的无限与常识是不一样的。
2016-01-23 16:25:27 回复
有种说法,内经和伤寒论使用的是“定性”的方法。
建议看我以前讨论《黄帝内经》的帖子,很详细。
2016-01-23 16:17:51 回复
laftodeath
2016-01-22 23:11:54
至于删谁不删谁,那也只是表象。美国生物统计学和因果推断是两个方向,就和数学和理论物理关系有点类似,关系极其密切,最终目的不完全相同。
双盲实验的起点是频率学派,但是总有前导知识,总能正式地或者非正式地使用贝叶斯方法。但是贝叶斯法也是双刃剑,就像一把枪,看你怎么用了。
我想说的是:双盲试验本质就是江湖蒙古大夫批一个科学马甲,在赌经验。当年葛兰素史克吃死人的文迪雅也是通过双盲试验的。在被美国FDA禁用之前,我也在吃,我运气好,没死。吃死多少人?
这就是赌输了的例子。葛兰素史克在这个药上亏损20多亿美元,再加上赔偿死者的上百亿美元,双盲试验其实风险极大。
2016-01-23 16:17:00 回复
原来学数学的也有这种解释现实的争论,真是没想到。原以为数学是抽象学科,是不是自然科学都得另说,怎么会有这种解释现实问题?只有像物理这种才有哥本哈根学派和爱因斯坦之争。话说当初刚看到玻尔那个氢原子模型也太粗糙了,这也弄得出一个学派?另外概率和统计要算应用数学,不算所谓的纯数学吧?
科大数理统计现在不在数学系,在管理学院。
概率论算应用数学。
2016-01-23 16:06:44 回复
Leon温陵
2016-01-23 12:56:58
不完全是,google发家的搜索排序算法是pagerank算法,后面的数学是矩阵、线性代数和马尔科夫过程。当然现在是什么就不是很清楚了。
我看的是前几年介绍资料,说他们搜索基础算法是马尔科夫链+贝叶斯决断。
2016-01-23 15:56:50 回复
deepVar
2016-01-23 14:59:07
贝叶斯理论非常核心。个人觉得机器学习的两个主要理论基础是PAC学习理论和概率图模型。其中概率图包括贝叶斯网和马尔科夫网,即有向图和无向图。
实际中,使用频率观点求参,还是贝叶斯对参数积分,往往由问题的复杂度决定。现在即使由于计算机发展,采样变得容易,但很多情况下仍然困难。
另外,曾经问过一个科大统计的学生,感觉其学科体系没有包括统计学习的内容,也许有些老化。但科大的学生在机器学习领域还是很厉害的。
我讲的情况仅限于78级数学系数理统计专业。现在情况不是这样,现在科大数理统计不在数学系,而在管理学院,现在他们主流是贝叶斯了。
2016-01-23 15:55:52 回复
laftodeath
2016-01-23 21:45:44
真是同一个意思。我说的也正是您在另一个回帖里说的认识论的问题。
不过目前没有比双盲更好的办法,这是人类目前的认识水平决定的。物理学遇到过这个问题,因果性在量子层面引发无数讨论,但并没有最终结论。
而在宏观层面,至少目前没有看到绕过去的方法。
关于GSK文迪雅的问题,忙总过于武断了。逻辑上吃死人是必然的,只是需要衡量成本收益罢了。双盲试验提高揭示治疗效果的把握度的同时,也是降低了发现不良反应的能力,这是逻辑上的必然,也就是双刃剑的意思。
现实的做法是知道这种方法的问题所在,而不是把大夫都说成是蒙古大夫。
我其实想说的意思是:葛兰素史克把双盲试验当成程序正义了,认为只要做了双盲试验,就可以免死。当年复方丹参滴丸(天津天士力)去美国申请上市,葛兰素史克的人就说:这玩意没经过双盲试验,是假冒伪劣货。
双盲试验不能避免病人死亡,同样,没经过双盲试验的复方丹参滴丸也未必就是坏蛋,我吃了15年,连续吃,每天吃,也没见什么问题。
在法律上我们都知道,程序正义不能代替事实正义。葛兰素史克偏要这么做,其实算,双盲试验是西方医药集团打压中药的基本工具和武器。可是这个武器本身也是不靠谱的。
一切争论都是利益在刀光剑影。每年中国几万亿的药品市场,让多少美国医药公司老板半夜梦醒,咬牙切齿。
2016-01-24 11:35:52 回复
Cousteau
2016-01-24 11:19:45
是这样的。数学书本上的能够理解,自己帮忙写过的讲义(考研辅导兼职)也被认可。可是无限和连续统概念和现实中对应起来总是隔着一层:以前看过庞加莱写的《最后的沉思》,不知道是翻译问题还是怎么回事看着也隔着一层。后来看毛主席同李政道对话录(有演义成分),感觉反倒清楚些。
看来你的数学基础不够,主要是实变函数没学好。这个是初等数学和高等数学之间的门槛,你还没有跨过去。
你说这些,在实变函数中,都能解决。
2016-01-24 11:41:02 回复
laftodeath
2016-01-24 12:29:20
这没办法。西方药厂之间用这个程序正义相互厮杀,而文迪雅恰恰就是他们互撕的好例子。
当然天天吃也不证明什么,比如公鸡天天在太阳升起之前打鸣,但是却不是太阳升起的原因。
你精神上太自虐了,你的说法相当于:中国就算成为世界第一,因为采用的是非民主体制,所以不能证明是对的;洋大人就算死翘翘了,但是因为采用的民主体制,所以不能证明是错的。
这太自虐了。不好意思再说了,也不忍心再说了。
2016-01-24 17:47:01 回复
Cousteau
2016-01-24 15:29:52
忙总批评。我不是科班出身,实变函数是课能讲、题能做、论文能看(大言不惭呵,纯粹为谋食性质在换工作间隙干过小半年),可是自问懂不懂我打怀疑。
丘成桐就把理不理解在集合上定义抽象算法来判断是不是适合学数学。
2016-01-24 17:44:50 回复
忙总,文迪雅被重罚,主要是故意隐瞒不利的临床数据,而非主要因为副作用。一个药物上市后,还会经历四期临床试验、药物警戒等,确保安全、有效、质量可控。
比如2000年上市、2010年退市的减肥药西布曲明(国内销售最好的是太极的曲美),退市的主要原因也是上市后双盲试验提示心血管疾病风险提升,并未罚款:
“SCOUT(Sibutramine Cardiovascular Outcome Trial)名为“西布曲明心血管终点试验”,是由欧盟人用药品专家委员会批准,雅培公司开展的上市后研究。这项随机、双盲、安慰剂对照研究始于2002年,长达约6年,注册了约1万名55岁及以上、超重或肥胖、并已有心血管疾病史或Ⅱ型糖尿病史、或还存在其他心血管疾病风险的受试者,用于评估使用西布曲明后体重下降对心血管的影响。SCOUT研究结果显示西布曲明3年平均减重仅为约2.7公斤,而由此引发的死亡和心血管事件(包括非致死性心梗,非致死性卒中,可复苏的心脏骤停,心血管死亡等)上升了约16%,减肥治疗的风险大于效益——这也直接促成了欧美随后对西布曲明的退市限令。”
如何证明一个药物是安全、有效、质量可控?目前为止,双盲试验可能是现阶段最好的方法了,上市后还需要对不良反应持续监测,药监局有专门部门负责,国内2002年好像才开始建立。
药品研发历史其实很短暂,监管其实是在一次次重大药品事故中逐步完善的。
美国1938年“磺胺事件”推动了FDA监管法案的批准,要求①将所有药品成分公布②药品需做上市前审评,证明其安全性。
1950年代末,沙利度胺上市时用于孕妇晨吐,最终发现对胎儿有致畸性,全世界一万名新生儿受影响,大多数成为没有四肢的“海豹儿”。FDA从此声名鹊起;严格临床试验及立法就此铺开。这款药物是德国公司Gruenenthal研发,2010年赔偿~5亿欧元给受害者。也正是这一事件,欧美60年代、70年代清理了一大批历史原因造成的无效药物批文。
国内的药品批文数量是天量,主要形成于大跃进、文革时期,中央大幅向地方放权,省乃至地级市均可以批准药品。新药审批权直到1985年才收归中央。90年代大放权时代,又一大批药品获批。1998年全国食药监局才建立,郑筱萸任局长。02年”地标”转“国标”,本想清理这些垃圾批文,最终虎头蛇尾。新药审批也一直松动的很,直到05年郑筱萸被抓,07年被枪毙。现在市面上,很多药物如果追根溯源,其实都不太清白。
现任药监局局长是毕井泉,曾担任国务院副秘书长配合岐山工作(后来好像配合汪),去年上任以来一系列举措还是深受业界欢迎,现在正在清理存量的申请上市批文,未来肯定要转向存量,拭目以待。
我稍微多说一点。
争夺评价标准这个不是政治,是国家地位和实力的标志,是中国国力发展一个必然的结果,不可避免。
中国以前弱,与西方在标准上没冲突,因为我们一个是没资格抗争,第二个是没利益动力抗争,所以我们国家是大国中最没有独立自主标准的国家(不如印度、南非、巴西、俄罗斯等等),我们几乎所有质量标准,产业标准,甚至经济评价标准,都全盘接受西方的标准(这跟286实用主义的白猫黑猫指导理论有关)。可是当我们开始发展后,立即面临标准的利益冲突。
产业标准上第一个大冲突是通信领域的无线通信标准,最后两败俱伤,不过中国最终在付出巨大代价后,还是建立了自己的3G和4G标准,虽然从经济上讲其实是得不偿失,但是从此在安全上不再受制于人,而且获得了产业进一步发展的空间,从长远来说是值得的。
紧跟着的冲突就是产品质量标准。中国本来是完全融入ISO9000系列标准体系中的国家,可能比欧盟的国家(例如德国、法国等等)更彻底,因为我们国标=ISO9000+美国+德国+日本质量指标弱化一个等级。可是美欧日为了阻挡中国企业扩张市场,提出了很多自称为非关税壁垒的质量标准,例如欧盟的绿色标准,日本的节能标准,美国的劳工保护标准,这些标准都是为中国量身定做的,所以出现了著名的轮胎反倾销,不锈钢反倾销,聚酯切片反倾销等等,中国受伤很重(例如山东广饶做出口轮胎生产的成片企业倒闭,中国是世界轮胎第一生产大国,广饶是中国轮胎第一生产大县,占全国生产能力20%,几乎全部出口)。
这也教导我们,我们必须有自己的标准,不然就是单项被宰。所以开始制定自己的产业标准和质量标准,所以这几年这种被宰的情况少了,因为我们也有宰人的标准了,美欧日再想宰,就会出现对宰现象,互相放血,看谁顶不住。例如荷兰飞利普曾经发起节能灯反倾销,结果被宰一次(商业贿赂和价格垄断),就老实了。
医药标准也是这一系列标准中的一个。我们的西药,基本都是仿制药(自己独创的一只手就能数过来),所以西方标准,就是我们西药的标准,但是中国巨大的中成药市场(目前占国内药品市场规模接近50%,超过一万亿人民币)却是西方医药企业一直想用西药标准来打倒并占领的地盘,如果我们放弃自己独立的标准,中药将逐渐不复存在。
但是中药如果按照西方标准,的确都将被淘汰。可是我们用几千年的人命测试出来的药,难道真的不如靠几个统计学家人为设计双盲试验测试出来的安全?再说双盲试验还是其他实验,逻辑上也是难以保证万无一失的。
不能用双盲试验当成免死金牌,只要双盲试验过关,即使药品出问题,也是上帝的事情;而中国人的东西,即使不出问题,也是必须淘汰的,因为你的程序不正义。这是典型的双重标准。
我们必须争夺这种标准。其实自从我们调查葛兰素史克贿赂案开始(四个中国区高管判刑,20人被拘留),就一直在争夺,最近葛兰素史克又把五个中国人以偷窃知识机密告上美国法庭为反击(中国也许会对其他西方大的医药企业一起动手例如阿斯利康、罗氏、辉瑞、拜耳、赛诺菲和礼来等等都进入了调查程序)。
当然另外一个更大的标准,那就是大宗商品定价标准,这个我们还在努力,估计很快上海就要推出石油期货交易所了。铜的定价权目前正在争夺中。
2016-01-25 12:03:13 回复
忙总,建议您单独发一个主题帖,让更多的人看见上面的内容,这里面水太深了,难怪很多人都看不清,各论坛上中医西医的辩论,基本上都是秀逻辑秀智商,很少有人从争夺评价标准这个层面去思考。
其实西方与我们争论什么民主,自由,平等,科学,其实最后一脱干净,都是争的钱。
如果中国还是民国初年军阀割据时代,绝对没西方人跟我们讨论什么民主自由平等博爱科学,他们唯恐你不乱,乱才能多卖军火,多赚钱。
我最近看到一些当年西方公司卖军火给贵州军阀的原始文件,那时不跟我们讲什么民主博爱了,教会的牧师神父当担保,抵押是贵州汞矿40年开采权(现在是世界储量第三的汞矿,中国第一)。
2016-01-25 12:12:24 回复
土豆烧牛肉
2016-01-25 11:55:05
铁矿石这块有计划么?前些年可是被老外狠狠的宰了刀,当然,国内这边也不争气。
说到正义标准,似乎就普通民众而言更看重结果,估计也是经历得多了,口号也听得多了。
其实西方国家现在投票率低也有这个因素。
铁矿石主要是内奸,某个机构想自己盈利,当然最后是自己赚一块钱,让洋人赚10块钱。我想纪检委应该知道怎么回事,就看有没有胆量动这块。
2016-01-25 12:06:08 回复
我国铜产量占全球占比太低,铜定价权要抢过来不容易啊。中期内打成个均势,让铜价尽量低位运行,这倒是很符合国家利益。
现在利用实际用量+美元储备两个工具,可以逼空。其实正在在做。
有的玩家被逼交现货,已经认赔出场。
2016-01-27 11:22:18 回复
有点像公司法里面的否决权,34%则可。
如果这么说,乐观点,十年之内,大宗商品主导权基本可以收入囊中。
全部大宗不太可能,我们稀缺的一定要控制。
2016-01-29 10:49:10 回复
嘉能可之前就是一贯玩霸盘哄抬价格的,这次相当够呛,破产都有可能,还有来宝,农业部门要卖给中粮了。
这次不倒下几个大家伙,这些投机商真的都不知道自己姓什么了。
2016-01-29 10:27:53 回复
民主博爱这些玩意可以称作洋儒学,也是很有忽悠能力的,我看现在各年龄层的不少人都吃这套。
其实还是不自信+无知导致的。读书太少。
2016-01-29 10:27:14 回复
吃狼的绵羊
2016-01-31 13:23:35
感觉陈熙儒也是看低贝叶斯派的,虽然没有明说,但是他在这本书中,是这样描述的:他们“自称”为贝叶斯统计。”所谓的”贝叶斯统计派“号称”xxx。。。用自称,所谓,号称这几个词感觉就是得不到他的认可
陈希孺的世界观不能接受世界是不确定的,所以不能接受贝叶斯学派。
2016-02-02 10:37:46 回复
然后203
2016-01-31 13:41:07
高盛从15年年中转向唱多,似乎是看到这个苗头了。
2015年美国多个著名对冲基金也是颜面扫地。
高盛跟中国政府的关系非外界所能想象。
2016-02-02 10:36:43 回复
一休哥们儿
2016-03-09 15:43:47
谷歌Alphago赢李世石,李世石中盘认输,有点出人意料,人工智能发展太快了,围棋这块人类的堡垒也守不住了
人工智能在30多年前在我国是个热门专业,当时我在中科院的室友就是干这个的,但是当时只是理论追踪,成就不大。不过当年他们承担的项目,现在已经实用化,按照我认识的人的职位和军衔来看,应该在某些武器系统中实战化并部署了。至于民用的人工智能,我还不清楚。
2016-03-10 17:42:12 回复
忙总 能讲讲人工智能现在在我国发展的情况吗?像类脑计算 深度学习之类
这个行业不了解,再说我们的主要方向和成果是保密的,连国家科技大奖名单上都不能上的。
2016-03-12 10:18:18 回复
股市里的江恩是时间序列,缠论是贝叶斯技术,垃圾邮件的判别基本上是贝叶斯加正向判断:关键字,邮件指纹
机器学习本质都是贝叶斯的。这次这个下围棋的狗,也是基于经验积累和分析算法的。
2016-03-13 10:59:20 回复
第4局李世石中盘翻盘了,刚才乐 视的直播室好欢乐啊,柯洁(暂居世界排名第一)哈哈大笑。网络直播比电视直播喜感多了。AI还是有点不靠谱啊,不过应该是工程问题,本质上AI还是胜了。
算法没问题,只是学习背景需要增加而已。机器学习是渐进过程,效率比人学习效率还高。
2016-03-14 11:36:49 回复
napolean
2016-03-14 17:15:36
那忙总您怎么看ai未来的发展,会在哪些领域最有可能对人形成替代
这个无法判断,原则上不需要创造概念,范式和算法的领域,机器都可以替代。
2016-03-17 10:50:11 回复
机器能用算法出感情吗,搞出所谓的情感心理医生机器人?
人工智能定义不是这样定义的,我专门写一个帖子介绍一下。
2016-03-17 10:49:07 回复