个人简历
晏瑞然
个人信息
手机:17362950656
邮箱:yanruiran@mail.ustc.edu.cn
github:RuiranYan
主页:ruiranyan.github.io
教育背景
2019年9月 ~ 至今
中国科学技术大学(USTC) B.E. 少年班学院,大数据专业
个人技能
编程语言:熟练使用python及其常用模块,熟悉C/C++、MATLAB、LATEX、markdown等语言。
操作系统:熟悉Linux,个人笔记本便是使用linux系统,能在Linux环境下进行开发。
数学:熟练掌握数学分析、线性代数、概率论与数理统计、离散数学、随机过程等数学知识,并在这些课程中取得优异成绩。
英语:经常阅读英文文献、观看英文课程。
兴趣爱好
吃饭、睡觉、打csgo。
My First Competition in Kaggle
My First Competition in Kaggle
纲要
前言
比赛任务
项目流程
项目内容
pre-processing
training
testing
结果及总结
前言
在此之前我就对kaggle平台有所了解,也参加过一次比赛(跟着大佬混的,后面还鸽了)。这次因为深度学习课程要求,算是我第一次从头到尾完整的参加比赛,特此记录。同时感谢本次比赛我的partner LZR大佬的贡献与帮助。
比赛任务
加入比赛后做的第一件事自然是查看任务。本次任务也不是很复杂,很好理解。
比赛任务主要是对鸟类音频进行识别,识别给定音频中是否存在某些鸟类的叫声,以进行濒危鸟类的保护。比赛的数据主要是161种鸟类的叫声,需要得到一个能识别21种鸟类的识别器。数据通过一个表进行索引,表中有音频的file名以及所有的信息(包括label以及2nd label、label可靠度等)。
项目流程框架
所有的代码分为三个阶段,分别是数据处理、模型训练、模型inference,由于是kaggle比赛,使用kaggle notebook(类似jupyter notebook)对代码进行保存,故每次得 ...
我与科大
写在前面的话
现在是2022年9月9日,距离这篇文章的开篇已经过去了将近7个月(由此可见本人咕咕咕的能力)。
现在已经是大四了,也算是闲了下来,每天有大量的时间用来挥霍(打CS),实在闲得无聊,就决定补一下以前的坑了。由于大学以来语言功能已经大幅退化,文章从语言学的角度肯定是垃圾中的垃圾,就当是个行就将木的老人随便絮叨记录下来的杂乱无章的文字吧。如果能对读者的生活带来一些帮助,那是再好不过了。我也对此没有什么期待,只是想把这篇文章作为对科大生活的一个记录,讲一讲我与科大的点点滴滴,毕竟科大承载的是我四年的青春,有美好有痛苦,但这就是生活,它值得被记录。
本文以时间顺序记录,早期(大一大二)的生活可能已经记不太清了,只能尽力去回忆,记不住一些细节了,希望不会影响观感。
目录
缘起
大一
大二
大三
大四(未完待续)
缘起
高中的我是一名标准的理科学生,与很多科大学生一样,都是在高中的时候做竞赛的。本人是物竞人,但只是个省二彩笔,但我对物理还是比较喜欢的,这也造成了在后面选择专业时我的纠结。当然在当时,物竞的经历也带给我了对科大的憧憬。经常能在培训的过程中看到许多科大老师的身影(点名叶 ...
SVCCA
Singular Vector Canonical Correlation Analysis for Deep Learning Dynamics and Interpretability
数学相关知识:
CCA(canonical correlation analysis):
典型关联分析Canonical Correlation Analysis(CCA)是一种衡量两个源于同一个潜在过程的观测集合的相关性的方法,它通过寻找最优的线性映射,将数据集每一行的 nnn 维向量投影到一维空间中,在空间中计算两个数据集的相关性系数,将最大的相关性系数作为最终的相似度度量。
形式化上, L1:m1×nL_1:m_1\times nL1:m1×n 和 L2:m2×nL_2:m_2\times nL2:m2×n 是两个归一化后的矩阵,代表经过归一化处理后的两个输入的数据集。优化的目标即为
maxw∈Rm1,s∈Rm2ρ=⟨wTL1,sTL2⟩∥wTL1∥⋅∥sTL2∥\max _{w \in \mathbb{R}^{m_{1}}, s \in \mathbb{R}^{m_{2}}} \r ...
something about git and github
something about git and github
纲要
写在前面的话 (100%)
git与github(100%)
git操作方式(50%)
git原理(0%)
如何用git进行双系统同步开发(100%)
.gitignore的编写(100%)
hexo相关(100%)
detailed intro of github (include change private repo to public repo, delete repo)(0%)
git重构(100%)
一些奇妙小BUG(未完待续)
写在前面的话
本blog只记录一些简单的生活中常用的方法,要学习具体的git使用方法还是建议看专门的git教程,可以参考菜鸟教程,本人水平有限,文中难免出现一些错误,希望读者谅解并能提出,可以在留言区进行交流与讨论。
git与github
假设你是一个计算机小白,第一次听到git和githb,首先你得区分这两个东西。git是一个版本控制工具,而github是一个远程的代码托管服务器,代码托管在github中的repositories中。简单说,git是一个能帮你在你本地管理你代 ...
Embedding Watermarks into DNN
Embedding-Watermarks-into-Deep-Neural-Networks导读与复现
导读
Abstract: Significant progress has been made with deep neural networks recently. Sharing trained models of deep neural networks has been a very important in the rapid progress of research and development of these systems. At the same time, it is necessary to protect the rights to shared trained models. To this end, we propose to use digital watermarking technology to protect intellectual property and detect intellectual property infringement ...
GAN原文阅读调研
关于GAN的调研报告
摘 要: 生成对抗网络(Generative Adversarial Nets, GAN)是当今数据分析领域重要模型之一,本次调研从第一篇提出GAN的论文Generative Adversarial Nets[1]出发,对GAN的结构、基本原理、算法、实验结果、模型优缺点等多方面进行了总结。最后还对GAN的衍生模型进行了简要介绍与分析。
关键词: 深度学习;数据分析;GAN;DCGAN;CGAN;ACGAN;
引言
近年来,由于算力的提升,人工智能得到了火热发展,神经网络也成为该领域的研究热点,但大多数神经网络都是一种判别器模型,即从特征出发,通过网络判断对象的类别。而2014年,由Goodfellow等人提出的Generative Adersaril Nets(GAN)却可以实现一个生成器的功能,即通过对象生成对象,通过真样本生成假样本。这种强大的功能使得GAN瞬间成为数据分析与人工智能学界热门研究方向,大量基于GAN的论文在近几年内涌现,一时间GAN风光无限,就连著名的卷积神经网络之父——Yann LeCun都称GAN为“过去十年来,机器学习领域最激动人心的点 ...
introduction of hexo
本篇文章用来记录配置HEXO时碰到的问题
纲要:
简单介绍使用背景(为什么用)
hexo安装
部署方法
主题
评论功能
文章写法
数学公式与mermaid
标签、分类、页面创建方式(包括菜单中设置这些页面)
背景(本地img、bg加url、协议冲突、文件部署方式)大坑!
未完善功能:文章封面、页面顶部图、留言板、友链、音乐、movie等…
与wordpress比较
多终端工作(补充)
结束语
缘起:
怎么说呢,从接触计算机开始,就想要拥有一个自己的网站,因为我认为这会是一件很cool的事情。当时的我对计算机的底层毫无了解(虽然现在也是QAQ), 而网站作为普通用户与计算机交互的重要接口,自然对当时想要了解计算机的我有着强烈的吸引力,拥有一个自己的网站的想法便应际而生。之后到了大学被C语言疯狂折磨,一直觉得底层的代码实现是件枯燥无聊的事情,认为计算机的主要功能应该是面向大众也就是交互友好应该是最重要的,然而当时完全是对着黑框框编程。现在的我则完全相反,黑框框多香,SB才喜欢做交互(笑)。当然,也正是因为这些底层方面的学习(从用户的角度来说的底层而不是计算机底层,或者说是代码层吧,毕竟 ...