碎语 2020 Sep.

2020/9/25

  • “一旦危机结束,誓言和承诺就很容易失去力量。”
  • 观点:太多人把defi当作余额宝在用了。但实际上,流动性的作用在于治理。

  • 【best】Placeholder

    • 平台的作用之一,是供给和需求的统一处理。是你永远不知道接你单的人是谁。这意味着什么:流动性(超越人们选择偏差的流动性,为什么我们会觉得抖音是一个更多样且美好的视频平台)。为什么流动性重要:因为能够帮助估价(举例:评估一桶石油最好的方式不是拿它去街边叫卖,而是把他兑换为原油期货通过高频交易来得知原油的需求供给平衡)。
    • 是什么让Maker, Compound, Uniswap变得独特?不是交易形式和选择。为什么是这些平台获得了更多的流量?关键在于AMM(永不停机的自动坐市商 & 更及时的价格变化)自动做市商提供的功能是:解决长尾资产的匹配。而这些选项,往往是中心化交易所所不能提供的。举个例子:可能每个平台都会推出自己的ERC20币种作为治理货币 & 收益货币。Augur上long ETH

      【创意】如果把ERC20类比为个人的社交货币。我们需要一个社交场景是,能够解决任意两者社交货币之间的转换。而不依赖中心化社交媒体平台的认证。
      -> 甚至说,从社交媒体的权利结构中发现,平台会尝试割裂不同的社交货币之间的兑换,从而强化平台流通的作用。便于治理。让用户与用户之间的沟通变难,让沟通只能够发生在平台和用户之间,在平台应允的空间里。
      -> 这也是那些中心化交易所或P2P呈现的作用,他们将流动性切割成独立地,只有他们才认证的单元。人为制造流动成本,并以解决凭空创造成本的做功抵于其价值。是谓平台之恶。
      -> DEX, AMM所提供的价值,是创作出了一个等价交换物,能够依赖高频次高容量的pair对,将不同资产的流通性打通。

    • “Protocols like 0x, Augur, and Dharma are genuinely P2P。”去中心化的意思变了,不再是节点状,n^2的复杂度叫做去中心化;而是2-hop抵达任意子节点,通过一个非中心化控制的“中心”。- 真正的去中心化?全能全知的市场,能够解决很多原始P2P场景下价格由人为设定的场景。**
      • 甚至说人是最不可靠?
      • 货币的诞生,解决了coincidence of wants(需求同步性 -> 异步性)。
    • 平台:成为异步。让信息/服务找你,而不是你去找服务。

货币即治理(capital as governance),即从加密货币看平台治理

  • 的意思是货币价值是系统价值的转移。对拥有部分经济资源的认可。同样也意味着:治理即资本(拥有治理能力也变相拥有了资本)。
  • 价格优先代表的只是局部供需关系。举个例子:一个富人把自己几亿元的货币烧了,短期不会影响市场交易价格,但如果一个猪肉供给商丢了十万资本,它会涨价。也反应了局部信息。
  • 【观点】经济和政治的视角去构建一个系统。
    • 经济:自发行为是什么。内在激励是什么。如何通过规则引导和改变行为。(哈耶克的自由市场,人们不必依赖善意从而互惠,人们在满足自己利益的同时也在帮助他们)。
      • 货币。定位:最小等价代表物。最小:意味着可组合性质(composibility)。等价代表物:意味着广泛的覆盖长尾资产的共识。
      • 资产。定位:不可篡改的工作量证明。
      • 和流通规则。定位:上两者之间的相互流通和转换。

        对话的时候,需要明确定义。或者至少尝试去理解对方的隐藏定义。

    • 政治:谁会去改规则,谁有权利改。如何打破马太效应。
  • 【观点】为什么token / Defi很有意思。曾经只有经济活动能够被资本化/证券化(公司股票代表人们对公司资本的管理权和分红权)。但现在,可能政治活动,社交活动都能够被资本化。而曾经在资本市场为了提高资本流转效率而发明的金融衍生物和玩法机制,也将作用在政治活动,以及社交影响力活动上。利用杠杆一夜成名或者跌落神坛也将会更常见。
    • 不会稀奇的是:未来的剧本:被百万粉丝规划好,参与分红的偶像人生。
  • 【观点】pos和pow的比较。pos是改进了pow的同步性质,修正为异步。在适当可以接受的安全性下降的范围内实现相同功能,而毋需消耗自然资源。因为质押资本,意味着不需要当下做功。最安全的系统设计是:当下贡献 & 当下牺牲。安全次之的设计是:用曾经的贡献 & 曾经的牺牲。

2020/9/22

  • 快手极速版:可以解释为,对注意力的流动性挖矿。用户锁定注意力,然后获得token(金币)。金币的本质是通胀的,但是金币锚定的是人民币的价值,而不是平台的价值。导致通胀率不一致。
  • 价值来自于成本和对成本能够流通的共识。
    • “比特币的挖矿引入计算,也引入了能源。这赋予了比特币内在的价值。如今的DeFi挖矿,往往是质押资产,然后获得对应的奖励。”
    • 而defi的问题在于,质押资产的价值波动,会随着链路的变长而变大。
  • 【关键问题】流动性为了什么?稳定币项目需要质押这么大量的资金的意义是?

    • “COMP是Compound的治理代币,是ERC20代币,它允许持有人将代币委托给其他人投票。任何代币持有人可以参与Compound的治理。只要拥有1%的委托代币就可以发起治理提议,包括增加新资产、改变利率模型等各种协议的参数或变量。COMP不仅是治理代币,也是捕获其业务价值的代币。”
  • “YAM也是AMPL的分叉,只是添加了储备库等一些少数的新特征。而YAM当初能引爆社区,一个重要原因是它揉合了AMPL+YFI机制。”

影响力的变现 & 传播 & 交易

  • “最近有一个MEME的代币,在蓝狐笔记写稿时,它市值在2900多万美元,一共有28,000个MEME代币。这个项目有意思的地方在于它将NFT和DeFi结合起来了。
    Meme也是一个挖矿项目,不过它挖的不是代币收益。而是通过质押资产赚取限量版的NFT。总言之,Meme是去中心化的挖NFT的协议。
    当前Meme有两个矿池,一个是存入Uniswap上的ETH/MEME LP代币去挖LP Genesis上的NFT。一个是存入MEME代币挖Genesis上的NFT。”

  • 【观点】defi领域不存在聚合器aggregator。因为aggregator的出现前提是流动成本。是打破壁垒的那个工具/平台成为了聚合器。但是defi本身的friction是极小的。

    • 但是如果把人的认知引入就会出现不一样的判断:因为人的注意力和风险承担能力是有限的;随着市场选择增多,选择成本逐渐成为壁垒。

2020/9/20

ample

https://www.publish0x.com/block-enthusiast-an-exploration-of-things/rebase-the-implications-of-supply-smoothing-xropreg

  • 重要性:抵抗波动性,在不依赖抵押物和中心化银行的前提下。
  • 价格语言机:Ampleforth relies on Chainlink to provide data about the Exchange rate of Amples, as well as the Consumer Price Index (CPI) for the 2019 dollar.
    The CPI rate is used as the target rate, allowing Amples to adjust to inflation and is sourced from the Bureau of Economic Analysis.

    本质上只是对齐了宏观利率。局部利率仍然存在偏差和套利空间。
    如果将consumer price index应用在局部?

  • The best way to avoid Ample volatility is to lend it.

快手小剧场

商业模式解决了什么问题?

问题1: “事实:兔狲文化CEO坦承,早期短剧制作都是不盈利的。“很多人就会问,您这个短剧盈利模式是什么,我直说,没有盈利模式,都赔钱”。”
问题2: 为什么不去找优爱腾?1.短剧在长剧平台上有分发劣势。 2.网大网剧招商压力可能已经很大,短剧招商更不会太乐观。

  1. 前期制作成本。招商,众筹。(这一块如何和合成资产结合起来?)
  2. 制片人,制作好产品后关于未来版权收入 & IP经营。(对比电影发行的模式,电影发行其实是稍微落后的模式了。因为一锤子买卖。交割所有权(netflix的DVD历史))。【概念】流式收入。- 一个账号即使无法通过一部短剧爆火出圈,也可以实现账号粉丝沉淀。【概念】剧后影响力。**
  3. 公带私。剧带人。- 影响力分布的轴上,抖音占据公域上游,而微信占据私域下游。快手的优势在于统一公域宣发以及私域经营的场景。**

2020/9/13

  • 连自己睡觉时间都控制不了的人,怎么能控制自己的人生。

todo:注意力机制的应用总结

ICDM2018|SASRec—基于自注意力机制的序列推荐,附tf2.0复现代码 - 知乎

注:这篇文章其实和我现在做的transformer粗排模型结构一致。

  • 注意力机制在AFM、DIN模型中得到了很好的应用。
  • AFM,DIN(中的activation unit,其实是一种伪注意力)“例如对于阿里的DIN模型,采用注意力机制对用户序列进行建模,但交换之前历史的物品,并不影响最终的预测,因为DIN只是提高与目标物品相似历史物品的权重,模型中的历史行为并没有表现一种时间上的先后关系,严格来说并不算一种序列推荐。”
  • 一个比较有意思的观察:
    • 对于用户行为较稀疏(长视频)的场景,用户近期的行为会很重要。
    • 但是对于用户行为稠密(电商,短视频)的场景,兴趣演化和多元兴趣会很重要。
  • 一个有意思的观察:
    • 行为的序列究竟对于这个场景重不重要?需要强调序列性还是相关性?电商和短视频一个很大的不同之处就在于:电商行为存在明显的序列效应,且应该弱化相关性。因为用户买完一个商品后会继而买下一个商品,而不是出相似。但是短视频和广告推荐则不同。这个观察,可以反向去束缚内积矩阵。
  • Q: SASRec与BST的区别:
    • SASRec与BST似乎都是引入了Transformer,不过:
    • SASRec针对的是召回工作,它的候选物品池是海量的,且它在Self-Attention中并没有加入下一个预测的物品,并没有使用多头自注意力机制;
    • BST针对的是排序工作,即CTR任务,所以它的候选物品池很小,经过召回工作筛选过的,并且在Self-Attention的序列中具有历史用户行为和当前的目标物品;
  • 注:kernel size = 1, conv network = feed forward network

transformer

https://thegradient.pub/transformers-are-graph-neural-networks/

  • 为什么用multi-head.: 减轻不好的初始化对模型训练的影响。
  • 特征经过transformer之后会被映射到不同的量纲里。因此有 1. Layer norm。 2. scale dot-product,在分母用特征维度的根号。
  • 为什么增加一个MLP,投射到高维度,然后再映射到相同维度。为了提高模型的拟合能力。
  • 针对attention的复杂度是n^2的解法:由于在NLP中n可能会比较大,但是在推荐系统领域n会较小。尝试做sparse atteion, reformer,LSH,dilated window来对n维降维到一个较小的维度。
    • 或者一个hack的方式:将self-attention改为普通的attention。
  • transformer的时间复杂度。
  • Q: self-attention的思路来源于什么?
    • 回答:来自于信息抽取information retrieval/搜索的背景,当输入query的时候,通过匹配对应的key,来组成输出。当key是one-hot的时候,Value = Key.
  • Q: 为什么self-attention使用的时候是对输入Emdding做三个不同的线性变化而得到Q = We - E,K = Wk - E和V = Wv - E?

    • 回答:目的是为了降低复杂度,降维。尤其是在普遍的attention的场景里。query和key的维度往往不一样。需要通过矩阵变换来映射到一致的维度,例如:k。在self-attention里面恰好query = key.
    • 这也是一种对self-attention改进的方式。
    • 这个总结👍
      • https://stats.stackexchange.com/questions/421935/what-exactly-are-keys-queries-and-values-in-attention-mechanisms
      • 在GPT模型里面,通常用刀的是self-attention.
      • 在机器翻译里面,通常存在两个attention的应用地方。首先是对序列行为做self-attention(对目标源头和target 词汇),然后再做一次普通的attention,其中Q = 目标序列,K = V = 上一步的输出。
      • 而在推荐领域,Q = items; K = V = user sequence embedding.
      • 【todo】【模型想法】可以用这个思路去迭代rerank模型,将用户序列的self-attention也加入进来。
  • Q:transformer中self-attention的改进

    • 回答:比如可以用mask来组织信息穿越。因为前者的item是无法和后面的item形成交互的。
  • 如何在推荐系统中应用?
    • 回答:在最后用一层MF层(其实就是内积)。transformer用来得到更好的用户/物品表征。

cnGAN

  • 训练具有高度稀疏数据的机器学习模型的最有效方法之一是对输入特征之间的交互作用进行建模。

    意思就是使用一个encoder,在encoder空间来学习相似和转换。

  • 对于给定的目标网络编码,作者只从真实数据中提取不匹配的源编码

    【模型想法】用GAN的方式来做精排教粗排的模型。其中粗排就是Generator.
    去从源头解决这个问题。因为仅仅网络结构相似,或者隐层的数值分布相似,是不足以证明结构相似的。
    粗排去学习精排的输出。精排本身就是discriminator, 精排预估值 < x 的就是粗排的负样本。

为什么GAN在文本/推荐上用的比较少

  • 因为文本和和推荐都是离散场景。取到对应的文本词是通过softmax之后查表。这一层转换是离散的,也就是不能用梯度来优化。因为无论softmax分布平均还是分布集中可能都是对应同一个映射结果。而只优化softmax之前的output也是本末倒置的行为,和最终的目的不一致。

  • 很多时候,模型设计其实是样本流设计。

    • 【模型想法】训练一个短播放和hate的预估模型。相当于去预测用户不满意的程度。然后在正样本选取的时候,取用户短播放预估值最高的那个样本作为负样本。
      • 注:为什么不用ctr预估值最低的样本?因为ctr预估值并不等同于其物理意义。往往只包含相对含义。我们训练的是正方向。负方向不一定准。

2020/9/12

  • 抖音电商往下,快手电商往上。

    • 抖音电商往下游做支付,做抖音小店砍掉外链做闭环。因为他们的场景是品牌主广告,他们需要数据,最终为广告现金牛服务。
    • 快手电商来自直播。需要品质保障 & 分销。各自阶段更重要的一步。
  • “西瓜视频将与剪映深度合作。剪映支持一键导出视频,并发布到西瓜视频,进一步降低创作的门槛。此外还将推出全新的PC 端创作平台,为视频创作量身打造,提供全面的内容数据分析能力和创作工具。”

评估平台经济的角度

  • 平台市场势力 - 知乎
  • 问题一:我们所研究的平台,其成功是源于创新,还是源于我们不想看到的监管套利(还是仅仅因成功逃避对手需要承担的消费者和劳动保护而具备了市场优势。)?
  • 运营成本本就内生于监管。
  • 出租车市场的主导地位高度依赖监管。监管出租车的,不仅有成本高昂、数量有限的牌照要求,还有对经营费率的限制。长期以来,出租车企业乐见市场壁垒的存在。刺破这层壁垒,是优步成功的原因之一。优步平台的优势在于:在新的市场运营,又直接和旧的市场竞争。优步的资深战略副总裁如此形容这一点,“(我们)是技术企业,不受世界各地对交通企业的监管”。

    一个服务市场成熟(衰退)的体现,在于出现监管许可证、执照和价格管制甚至法律诉讼这些壁垒。
    垄断的状态 != 收税。垄断描述的是企业的客观情况,而收税是企业的主观策略。收税的方式有很多种,30%应用收入归app store是税,骑手消失的5分钟也是税,平台通过孤立个体达成的不平等合约和决策都可以理解为税。
    只不过当企业处于垄断状态的时候,收税所得的利润相比创新变得更容易了。
    因此当一个行业被头部集团垄断的时候,他们往往会为了维护自己收税的状态而给后来者制造出壁垒,故意制造稀缺性。

    而未来新的创新,往往在于跳出原有市场的监管。往往呈现的状态是:在新市场运营,和旧市场竞争同一批的用户/时长。
    对社交媒体来说,这往往意味着媒介的变化。twitter -> ins -> tiktok。
    对电商来说,这往往意味着链路的优化。

    而同时,在新市场里,平台对接的往往是孤立的个体。而非传统组织。

  • 国内都是直接跪下的状态。

  • 判断垄断的一个方式:是否具备锁定效应。对独有性的实现程度。

    • 2013年时,在谷歌更改经营行为、以打消对竞争的顾虑后,联邦通讯委员会决定不起诉谷歌。主要的顾虑在于:尽管有报告称谷歌搜索偏向自营的信息和搜索结果。由于搜索引擎大多相近,用户不具备锁定效应,转用其它引擎的成本较低。这打消了联邦通讯委员会的担忧。
  • 网络效应一般对应以下的场景:产品的使用“激发了有价值的互补品的生产”,而这又增加了原产品的价值。

  • 【创新】【观点】【年度】平台采取数字定价。具备很大的通证经济/整体调控经济的潜力。
    • 数字定价目的是解决局部的供需关系。而局部的市场议价,往往滞后于整体变化的供需关系。
    • 平台的意愿 > 个人议价的意愿。
    • 平台数字定价形成一个没有价格竞争的市场。因为算法定价快过人们察觉。
    • ampleforth的供需调节。

2020/9/11

  • 为什么会有财产权/专利,一开始是为了阻止对稀缺性的争斗。

2020/9/6

  • 【经济】研究一下货币设计。一个稳定币不能交易,一个可以在二级市场交易。
  • 【创业】从工具起步。做创意内容生产者的订阅工具。

理解stable coin

Yield Stable Coins #103. To explain the next part, we need to… | by Andre Cronje | yearn.finance | Jul, 2020 | Medium

  • 为什么1 USDT值1美元?因为1. 我们保证了兑换结果(暗示交易所/交易实体的存在), 2. 开放的兑换关系(任何人在任何时候都可以和中心实体交易来long 或者 short)。if I own 1 USDT, I can go to Tether as a registered entity, and trade 1 USDT for 1 USD.
    • 注:我们不讨论二级市场价格,因为 二级市场价格受到局部关键信息的影响很大。比如如果某人在某个时刻制造了恐慌/或者放出利好消息,能够更加容易地操控二级市场的买卖。
    • 关键是两个前提,一个是我们希望锚定的价格,这个兑换结果是我们决定的。然后就是开放的自由交易来**创造利差。- 比如:USDT is 0.9的时候我们想买入然后兑换成美元,USDT is 1.1的时候我们想卖。
  • 理解到这一层之后,去理解DAI。DAI是由ETH作为抵押物支持的。也就是存在一个交易所,让你给他多少ETH,他兑换给你一定数量的DAI。
    • dollar -> ETH -> DAI. 当DAI价格上涨的时候,我们需要通过先兑换ETH再来挖DAI,1. 链路更长,导致收益量下降,经济激励降低。2. 系统更加的波动,比如当ETH的价格下跌的时候,DAI会对应更多的ETH,也因此系统缺少足够的ETH来支持DAI的兑换(也就是挤兑银行的事件发生)
    • 能够减少挤兑的事件发生,也就能更好的维持价格的稳定。也就是说为什么资产池的大小很重要。或者说,当整体体量不变的时候,流动性更大能够支持更多的交易。

curve vs uniswap

  • curve交易所的激励机制。Every time someone makes a trade on Curve.fi, liquidity providers (people who have deposited funds onto Curve) get a small fee split evenly between all providers
  • 【经济】如果引入第三方合作方。找到市场原本存在双方所需要的entity(比如:流动性,注意力,钱,token都可以),然后允许第三方注入此类资产以提供流动性(liquidity provider)。1. 然后每当有交易依赖此类资产完成的时候,LP能够平均地获得分红。2. 注入的流动性资产的使用方式不是点对点(p2p)的,而是一个中心化的池子,同时注入compound获得comp的复利。双重激励。
    • 对应机制。
      • 简单,比如对应的资本玩法:1. 低粉作者。愿意资本支持的用户可以赞助并获得凭证token,此后这个作者通过作品接入广告收入/粉丝收入,按比例分红给原始的用户。
      • 进阶,对应的时间 / 注意力玩法。其实就是用户向系统注入时间 / 空闲的注意力。然后系统通过中心化的池子决定用于匹配到不同作品。

defi的繁荣是具备警示意义的。自动做市商的前提是,也是smart contract的意义本身,对虚拟抽象物的记账执行。现实中还有很多场景需要线下仲裁,无法被抽象证券化,产出流动性(比如不动产)。但当他们能够被虚拟交割的那天,也是defi进入每一个人生活的那天。

理解流动性挖矿

  • compound就是借方市场。
  • Andre Cronje的 Yearn finance, 其实就是一个资产管理系统。你deposit任何一个资产,然后他们去寻找利差。帮你去管理token资产。(聚合器)。问题就是把gas推高,然后最后把这个费用转移给用户。
  • 和时间田忌赛马。
    • 只把时间留给决定战局的事情上。
一起加油!