重温《JavaScript高级程序设计》—4-变量、作用域和内存问题

本篇内容

基本类型和引用类型
复制变量和传递参数
类型检测
执行环境及作用域
垃圾收集机制及解除引用

基本类型和引用类型的值

JavaScript变量松散类型的本质，决定了它只是在特定时间用于保存特定值的一个名字而已。由于不存在定义某个变量必须要保存何种数据类型的规则，变量的值及其数据类型可以在脚本的生命周期内改变。 ——CEMA-262第3版

ECMAScript变量可能包含两种不同数据类型的值：基本类型值和引用类型值。当我们把变量赋值给一个变量时，解析器首先要做的就是确认这个值是基本类型值还是引用类型值。

基本类型：简单的数据段（Undefined, Null, Boolean, Number, String），可以直接操作保存在变量中的实际值。
引用类型：可能由多个值构成的对象。引用类型的值是保存在内存中的对象。与其他语言不同，js不允许直接访问内存中的位置（不能直接操作对象的内存空间）。在操作对象时，实际上是在操作对象的引用而不是实际的对象。

下面是基本类型和引用类型的几个主要不同点：

1.动态的属性

对于引用类型的值，我们可以为其添加属性和方法，也可以改变和删除其属性和方法；但是我们不能给基本类型的值添加或改变属性，虽然不会报错。

如：

var _obj = {};
var _str = 'test';

_obj.name = 'Micheal';
_str.name = 'Micheal';

console.log(_obj.name);	// 'Micheal'
console.log(_str.name);	// undefined

var _test = 'test string';
_test.toUpperCase = 'hahaha';

console.log(_test.toUpperCase());	// 'TEST STRING'

2.复制变量

在从一个变量向另一个变量复制基本类型值和引用类型值时，也存在不同。

2.1 基本类型的变量复制：如果从一个变量向另一个变量复制基本类型的值，会在变量对象上创建一个新值，然后把该值复制到为新变量分配的位置上。改变其中一个变量，另一个变量不会受到影响。

如：

1
2
3

var a = 10;
var b = a;
b = 20;

如下图所示，a中保存的值是10。当使用a的值来初始化b时，b中也保存了值10.但b中的10与a中的10是完全独立的，可以理解为在内存中创建变量b并把a复制一份给予b，该值只是a中10的一个副本而已。此后这两个变量可以参与任何操作而不会相互影响。如之后给b赋值20时，b的值为20，但此时a的值仍为10。
基本类型复制

2.2 引用类型的引用复制：当从一个变量向另一个变量复制引用类型的值时，同样也会将存储在变量对象中的值复制一份放到为新变量分配的空间。不同的是，这个值的副本实际上是一个指针，而这个指针指向存储在堆中的一个对象。复制操作结束后，两个变量实际上将引用同一个对象。改变其中一个变量，就会影响到另一个变量。

如：

var obj1 = {
	name: 'Micheal'
};
var obj2 = obj1;

obj2.name = 'Jack';

console.log(obj2.name);	// 'Jack'
console.log(obj1.name);	// 'Jack'

obj1.age = 30;
console.log(obj1.age); // 30
console.log(obj2.age); // 30

如下图所示，首先变量obj1保存了一个对象的实例。然后这个值被复制到了obj2中；换句话说，obj1和obj2都指向同一个对象。这样，当为obj2添加name属性后，可以通过obj1来访问这个属性，因为这两个变量引用的是同一个对象。
引用类型复制

3.传递参数

ES中所有函数的参数都是按值传递的。把函数外部的值复制给函数内部的参数，就和把值从一个变量复制到另一个变量一样。基本类型值的传递如同基本类型变量的复制，引用类型值的传递如同引用类型变量的复制一样。

3.1 向参数传递基本类型的值时：按值传递。被传递的值会被复制给一个局部变量（即命名参数，或称为arguments对象中的一个元素）。在向参数传递引用类型的值时，会把这个值在内存中的地址复制给一个局部变量，因此这个局部变量的变化会反映在函数的外部。

如：

function addTen(num) {
	return num += 10
}

var count = 20;
var result = addTen(count);

console.log(count);	// 20
console.log(result);	// 30

这里的函数addTen有一个参数num，是函数的局部变量。在调用这个函数时，变量count作为参数被传递给函数，这个变量的值是20。于是，数值20被复制给参数num以便在addTen函数中使用。在函数内部，参数num的值被加上了10，但这一变化不会影响到函数外部的count变量。参数num与count互不相识。

打个比方，向参数传递基本类型的值好比抄作业，在自己的作业本上复制别人作业本的内容。

3.2 向参数传递引用类型的值时：按共享传递(call by sharing)。被传递的值和函数的局部变量指向同一个对象。

function setName (obj) {
	obj.name = 'Micheal';
}

var person = {};
setName(person);
console.log(person.name);	// 'Micheal'

这里的代码创建了一个对象，并将其保存在了变量person中。然后这个变量被传递到setName函数之后就被复制给了obj。在这个函数内部，obj和person引用的是同一个对象，也就是说，即使这个变量是按值传递的，obj也会按引用来访问同一个对象。于是当在函数内部为obj添加name属性后，函数外部的person也将有所反应，因为person指向的对象在堆内存中只有一个。

打个比方，向参数传递引用类型的值时，就是你知道可以抄谁的作业，有人来问你时，你可以告诉他可以去看某某的。

注意：

function setName (obj) {
	obj.name = 'Micheal';
	obj = {};
	obj.name = 'Jack';
}

var person = {};
setName(person);
console.log(person.name);	// 'Micheal'

这个代码相比之前多了两行，一行为obj重新定义了一个对象，另一行为该对象定义了一个带有不同值的name属性。在把person传递给setName后，其name属性被设置为’Micheal’，然后又将一个新对象赋给变量obj，同时将其name属性设置为’Jack’。当函数内部在重写obj时，这个变量引用的就是一个局部对象了，而这个局部对象会在函数执行完毕后立即销毁。对象是按值传递的而不是按引用传递的。

可见以下几个例子：

var obj = {x : 1};
function foo(o) {
    o = 100;
}
foo(obj);
console.log(obj.x); // 仍然是1, obj并未被修改为100.

4.类型检测

typeof：typeof是检测String, Number, Boolean, Undefined四种基本类型的最佳工具。检测引用类型时用处不大（包括基本数据类型null: typeof null === 'object'）。
instanceof：可以检测引用对象，不能检测上面四种基本类型。语法“Boolean结果 = 变量 instanceof 构造器”。所有引用类型instanceof Object都返回true，因为所有引用类型的值都是Object的实例。

var person = { name: 'Micheal' },
	colors = [255, 255, 0],
	reg = /\/(.*)\//;

console.log(person instanceof Object);	// true
console.log(colors instanceof Array);	// true
console.log(reg instanceof RegExp);		// true

constructor：instanceof不能检测Number, String, Boolean,。Object.prototype.constructor返回一个指向创建了该对象原型的函数引用。此方法不能检测null和undefined。
Object.prototype.toString.call：万能

function Type() { };
	  
var toString = Object.prototype.toString;
console.log(toString.call(new Date) === '[object Date]');  // true
console.log(toString.call(new String) ==='[object String]'); // true
console.log(toString.call(new Function) ==='[object Function]'); // true
console.log(toString.call(Type) ==='[object Function]'); // true
console.log(toString.call('str') ==='[object String]'); // true
console.log(toString.call(Math) === '[object Math]'); // true
console.log(toString.call(true) ==='[object Boolean]'); // true
console.log(toString.call(/^[a-zA-Z]{5,20}$/) ==='[object RegExp]'); // true
console.log(toString.call({name:'wenzi', age:25}) ==='[object Object]'); // true
console.log(toString.call([1, 2, 3, 4]) ==='[object Array]'); // true

// Since JavaScript 1.8.5
console.log(toString.call(undefined) === '[object Undefined]'); // true
console.log(toString.call(null) === '[object Null]'); // true

执行环境及作用域

执行环境：execution context，执行环境定义了变量或函数有权访问的其他数据，决定了它们各自的行为。
变量对象：每个执行环境都有一个与之关联的变量对象（variable Object），执行环境中定义的所有变量和函数都保存在这个对象中。虽然我们编写的代码无法访问这个对象，但解析器在处理数据时会在后台使用它。

全局执行环境是最外围的一个执行环境，根据ES实现所在的宿主环境不同，执行环境的对象也不一样。例如在web浏览器中，全局执行环境被认为是window对象，因此所有全局变量和函数都是作为window对象的属性和方法创建的。某个执行环境中的所有代码执行完毕后，该环境被销毁，保存在其中的所有变量和函数定义也随之销毁。全局执行环境直到应用程序退出时才被销毁，例如关闭网页或浏览器。

每个函数都有自己的执行环境。当执行流进入一个函数时，函数的执行环境就会被推入一个环境栈中。而在函数执行之后，栈将其环境弹出，把控制权返回给之前的执行环境。

作用域链：scope chain，当代码在一个环境中执行时，会创建变量对象的一个作用域链。作用域链的作用是保证对执行环境有权访问的所有变量和函数的有序访问。
作用域链的前端，始终是当前执行的代码所在环境的变量对象。作用域链中的下一个变量对象来自包含（外部）环境，而再下一个变量对象则来自下一个包含环境，这样一直延续到全局执行环境。全局执行环境的变量对象始终都是作用域链中的最后一个对象。
如：

var test = 10;

function showTest1 () {
	var test = 12;

	console.log(test)
}

function showTest2 () {
	console.log(test)
}

showTest1(); // 12;
showTest2(); // 10

这个例子想必不必解释

var color = 'blue';

function changeColor() {
	if (color === 'blue') {
		color = 'red';
	} else color = 'blue';
}

changeColor();
console.log(color);	// 'red'

在这个例子中，函数changeColor的作用域链包含两个对象：函数自己的变量对象和全局环境的变量对象。可以在函数内部访问变量color，就是因为可以在这个作用域链中找到color变量。

此外在局部作用域中定义的变量可以在局部环境中与全局变量互换使用，如：

var color = 'blue';

function changeColor () {
	var anotherColor = 'red';

	function swapColors () {
		var tempColor = anotherColor;
		anotherColor = color;
		color = tempColor;

		// 这里可以访问color, anotherColor, tempColor
	}

	// 这里可以访问color, anotherColor
}
	
// 这里可以访问color

内部环境可以通过作用域链访问所有的外部环境，但外部环境不能访问内部环境中的任何变量和函数

函数参数也被当作变量对待，因此其访问规则与执行环境中的其他变量相同。

延长作用域链

虽然执行环境的类型总共只有两种——全局和局部（函数），但还是有办法来延长作用域链。因为有些语句可以在作用域的前端临时增加一个变量对象，该变量对象会在代码执行后被移除。

try-catch语句的catch块(IE8及之前外部也能访问错误对象)
with语句
这两个语句都会在作用域链的前端添加一个变量对象。对with语句来说，会将指定的对象添加到作用域链中。对catch语句来说，会创建一个新的变量对象，其中包含的是被抛出的错误对象的声明。

如：

function buildUrl() {
	var qs = '?debug=true';

	with(location) {
		var url = href + qs;
	}

	return url;
}

在此，with语句接收的是location对象，因此其变量对象中就包含了location对象的所有属性和方法，而这个变量对象被添加到了作用域链的前端。

没有块级作用域

比如js中if语句或for循环语句中的变量声明（var）会将变量添加到当前的执行环境（ES6的let和const则不一样）

使用var声明的变量会自动被添加到最接近的环境中。如果初始化变量时没有使用var声明，该变量会自动被添加到全局环境中（严格模式报错）。如下面两个例子

function add (num1, num2) {
	var sum = num1 + num2;
	return sum;
}

var result = add(1, 3);
console.log(sum);	// ReferenceError

function add (num1, num2) {
	sum = num1 + num2;
	return sum;
}

var result = add(1, 3);
console.log(sum);	// 4

*特殊情况下，局部变量名与全局变量名重合，想在局部变量名的执行环境下拿到全局变量：

var color = 'blue';
	
function getColor () {
	var color = 'red';

	console.log(color + ' : ' + window.color);	
}
	
getColor();	// 'red : blue'

访问局部变量要比访问全局变量要快

垃圾收集

JavaScript具有自动垃圾收集机制，执行环境会负责管理代码执行过程中使用的内存。其垃圾收集机制的原理很简单：找出那些不再继续使用的变量，然后释放其占用的内存。为此，垃圾收集器会按照固定的时间间隔（或代码中预定的收集时间），周期性地执行这一操作。

用于标识无用变量的策略可能会因实现而异，但具体到浏览器中的实现，通常有两个策略。

1.标记清除（mark-and-sweep）

js中最常用的垃圾收集方式是标记清除。例如当变量进入环境时，在函数中声明一个变量，将这个变量标记为“进入环境”，当变量离开环境时，将其标记为“离开环境”。
垃圾收集器在运行的时候会给存储在内存中的所有变量都加上标记，然后它会去掉环境中的变量以及被环境中变量引用的变量的标记。而在此之后再被加上标记的变量将被视为准备删除的变量，最后垃圾收集器完成内存清除工作，销毁那些带标记的值并回收他们所占用的内存空间。

IE、Firefox、Chrome、Opera、Safari的JavaScript实现使用的都是标记清除式的垃圾收集策略，只不过垃圾收集的时间间隔互有不同。

2.引用计数（reference counting）

引用计数的含义是跟踪记录每个值被引用的次数。当声明了一个变量并将一个引用类型值赋予该变量是，这个值的引用次数就是1。如果同一个值又被赋给另一个变量，则该值的引用次数加1；相反，如果包含对这个值引用的变量又取到了另一个值，则这个值的引用次数减1。当这个值的引用次数为0时，说明没法再访问这个值了，因此可以将其占用的内存回收回来。

引用计数可能存在一个很严重的问题：循环引用。循环引用指对象A包含一个指向对象B的指针，对象B中也包含一个指向对象A的引用。
如：

function test () {
	var obj1 = {},
		obj2 = {};

	obj1.other = obj2;
	obj2.another = obj1;
}

此时如果以引用计数的方式，obj1和obj2的引用次数都不为0，所以它们将继续占用内存。如果持续调用该函数，就会导致大量内存得不到回收。

（IE9之前）IE中有一部分对象并不是原生JavaScript对象。例如其BOM和DOM中的对象就是使用C++以COM（component Object model）对象的形式实现的，COM对象的垃圾收集机制就是引用计数策略，因此会存在循环引用问题。如下例；

var element = document.getElementById('test');
var myObj = {};

myObj.element = element;
element.someObj = myObject;

此时element和myObj因循环引用的原因将永远得不到释放，必须得手动释放：

1 2	element.someOjb = null; myObj.element = null;

IE6及以前有个著名的性能问题，其垃圾收集器是根据内存分配量运行的，有兴趣的话可以去搜下，这里不具体介绍。
有的浏览器可以通过js触发垃圾收集过程，如IE的window.CollectGarbage, Opera的window.opera.collect方法，但不建议这样做。

关于js内存有几篇优秀的博文：

解除引用（dereferencing）

确保占用最少的内存可以让页面获得更好的性能。而优化内存占用的最佳方式，就是为执行中的代码只保存必要的数据。一旦数据不再有用，最好就是通过将其值设置为null来释放其引用，这一行为称为解除引用。如：

function createPerson (name) {
	var _person = {
		name: name
	};

	return name
}

var person1 = createPerson('Micheal');
	
// ...一通操作后不再用到person1
person1 = null;

注意：解除一个值的引用并不意味着自动回收该值所占用的内存，而是让值脱离执行环境，以便垃圾收集器下次运行时将其回收。

JavaScript内存优化

温习：

基本类型和引用类型的值，它们有什么主要区别
基本类型和引用类型在复制和传递参数时有何区别
typeof、instanceof、constructor、Object.prototype.toString.call检测类型时各自的优缺点
执行环境和作用域链的定义
标记清楚和引用计数的垃圾收集原理是什么
js的内存优化、解除引用

*本篇内容较为生涩，特别是原型链和垃圾收集机制，但其影响是绝不能忽视的。开发过程中很容易忽视变量的引用解除，虽然绝大多数时影响不大，但解除引用的习惯还是需要有的，比方接口返回内容有时会赋值于全局变量以便使用，处理完这部分数据后便可对引用null或delete一下了；还有就是减少全局变量的使用以及闭包函数的使用，这些都是能起到内存优化的好习惯。

（完）