如何使用Mutex确保并发程序的正确性

1. 简介

本文的主要内容是介绍Go中Mutex并发原语。包含Mutex的基本使用,使用的注意事项以及一些实践建议。

2. 基本使用

2.1 基本定义

Mutex是Go语言中的一种同步原语,全称为Mutual Exclusion,即互斥锁。它可以在并发编程中实现对共享资源的互斥访问,保证同一时刻只有一个协程可以访问共享资源。Mutex通常用于控制对临界区的访问,以避免竞态条件的出现。

2.2 使用方式

使用Mutex的基本方法非常简单,可以通过调用Mutex的Lock方法来获取锁,然后通过Unlock方法释放锁,示例代码如下:

import "sync"

var mutex sync.Mutex

func main() {
  mutex.Lock()    // 获取锁
  // 执行需要同步的操作
  mutex.Unlock()  // 释放锁
}

2.3 使用例子

2.3.1 未使用mutex同步代码示例

下面是一个使用goroutine访问共享资源,但没有使用Mutex进行同步的代码示例:

package main

import (
    "fmt"
    "time"
)

var count int

func main() {
    for i := 0; i < 1000; i++ {
        go add()
    }
    time.Sleep(1 * time.Second)
    fmt.Println("count:", count)
}

func add() {
    count++
}

上述代码中,我们启动了1000个goroutine,每个goroutine都调用add()函数将count变量的值加1。由于count变量是共享资源,因此在多个goroutine同时访问的情况下会出现竞态条件。但是由于没有使用Mutex进行同步,所以会导致count的值无法正确累加,最终输出的结果也会出现错误。

在这个例子中,由于多个goroutine同时访问count变量,而不进行同步控制,导致每个goroutine都可能读取到同样的count值,进行相同的累加操作。这就会导致最终输出的count值不是期望的结果。如果我们使用Mutex进行同步控制,就可以避免这种竞态条件的出现。

2.3.2 使用mutex解决上述问题

下面是使用Mutex进行同步控制,解决上述代码中竞态条件问题的示例:

package main

import (
    "fmt"
    "sync"
    "time"
)

var (
    count int
    mutex sync.Mutex
)

func main() {
    for i := 0; i < 1000; i++ {
        go add()
    }
    time.Sleep(1 * time.Second)
    fmt.Println("count:", count)
}

func add() {
    mutex.Lock()
    count++
    mutex.Unlock()
}

在上述代码中,我们在全局定义了一个sync.Mutex类型的变量mutex,用于进行同步控制。在add()函数中,我们首先调用mutex.Lock()方法获取mutex的锁,确保只有一个goroutine可以访问count变量。然后进行加1操作,最后调用mutex.Unlock()方法释放mutex的锁,使其他goroutine可以继续访问count变量。

通过使用Mutex进行同步控制,我们避免了竞态条件的出现,确保了count变量的正确累加。最终输出的结果也符合预期。

3. 使用注意事项

3.1 Lock/Unlock需要成对出现

下面是一个没有成对出现Lock和Unlock的代码例子:

package main

import (
    "fmt"
    "sync"
)

func main() {
    var mutex sync.Mutex
    go func() {
        mutex.Lock()
        fmt.Println("goroutine1 locked the mutex")
    }()
    go func() {
        fmt.Println("goroutine2 trying to lock the mutex")
        mutex.Lock()
        fmt.Println("goroutine2 locked the mutex")
    }()
}

在上述代码中,我们创建了一个sync.Mutex类型的变量mutex,然后在两个goroutine中使用了这个mutex。

在第一个goroutine中,我们调用了mutex.Lock()方法获取mutex的锁,但是没有调用相应的Unlock方法。在第二个goroutine中,我们首先打印了一条信息,然后调用了mutex.Lock()方法尝试获取mutex的锁。由于第一个goroutine没有释放mutex的锁,第二个goroutine就一直阻塞在Lock方法中,一直无法执行。

因此,在使用Mutex的过程中,一定要确保每个Lock方法都有对应的Unlock方法,确保Mutex的正常使用。

3.2 不能对已使用的Mutex作为参数进行传递

下面举一个已使用的Mutex作为参数进行传递的代码的例子:

type Counter struct {
    sync.Mutex
    Count int
}

func main(){
    var c Counter
    c.Lock()
    defer c.Unlock()
    c.Count++
    foo(c)
    fmt.println("done")
}

func foo(c Counter) {
    c.Lock()
    defer c.Unlock()
    fmt.println("foo done")
}

当一个 mutex 被传递给一个函数时,预期的行为应该是该函数在访问受 mutex 保护的共享资源时,能够正确地获取和释放 mutex,以避免竞态条件的发生。

如果我们在Mutex未解锁的情况下拷贝这个Mutex,就会导致锁失效的问题。因为Mutex的状态信息被拷贝了,拷贝出来的Mutex还是处于锁定的状态。而在函数中,当要访问临界区数据时,首先肯定是先调用Mutex.Lock方法加锁,而传入Mutex其实是处于锁定状态的,此时函数将永远无法获取到锁。

因此,不能将已使用的Mutex直接作为参数进行传递。

3.3 不可重复调用Lock/UnLock方法

下面是一个例子,其中对同一个 Mutex 进行了重复加锁:

package main

import (
    "fmt"
    "sync"
)

func main() {
    var mu sync.Mutex
    mu.Lock()
    fmt.Println("First Lock")

    // 重复加锁
    mu.Lock()
    fmt.Println("Second Lock")

    mu.Unlock()
    mu.Unlock()
}

在这个例子中,我们先对 Mutex 进行了一次加锁,然后在没有解锁的情况下,又进行了一次加锁操作.

这种情况下,程序会出现死锁,因为第二次加锁操作已经被阻塞,等待第一次加锁的解锁操作,而第一次加锁的解锁操作也被阻塞,等待第二次加锁的解锁操作,导致了互相等待的局面,无法继续执行下去。

Mutex实际上是通过一个int32类型的标志位来实现的。当这个标志位为0时,表示这个Mutex当前没有被任何goroutine获取;当标志位为1时,表示这个Mutex当前已经被某个goroutine获取了。

Mutex的Lock方法实际上就是将这个标志位从0改为1,表示获取了锁;Unlock方法则是将标志位从1改为0,表示释放了锁。当第二次调用Lock方法,此时标记位为1,代表有一个goroutine持有了这个锁,此时将会被阻塞,而持有该锁的其实就是当前的goroutine,此时该程序将会永远阻塞下去。

4. 实践建议

4.1 Mutex锁不要同时保护两份不相关数据

下面是一个例子,使用Mutex同时保护两份不相关的数据

// net/http transport.go
type Transport struct {
   lk       sync.Mutex
   idleConn map[string][]*persistConn
   altProto map[string]RoundTripper // nil or map of URI scheme => RoundTripper
}

func (t *Transport) CloseIdleConnections() {
   t.lk.Lock()
   defer t.lk.Unlock()
   if t.idleConn == nil {
      return
   }
   for _, conns := range t.idleConn {
      for _, pconn := range conns {
         pconn.close()
      }
   }
   t.idleConn = nil
}


func (t *Transport) RegisterProtocol(scheme string, rt RoundTripper) {
   if scheme == "http" || scheme == "https" {
      panic("protocol " + scheme + " already registered")
   }
   t.lk.Lock()
   defer t.lk.Unlock()
   if t.altProto == nil {
      t.altProto = make(map[string]RoundTripper)
   }
   if _, exists := t.altProto[scheme]; exists {
      panic("protocol " + scheme + " already registered")
   }
   t.altProto[scheme] = rt
}

在这个例子中,idleConn是存储了空闲的连接,altProto是存储了协议的处理器,CloseIdleConnections方法是关闭所有空闲的连接,RegisterProtocol是用于注册协议处理的。

尽管ideConn和altProto这两部分数据并没有任何关联,但是却是使用同一个Mutex来保护的,这样子当调用RegisterProtocol方法时,便无法调用CloseIdleConnections方法,这会导致竞争过多,从而影响性能。

因此,为了提高并发性能,应该将 Mutex 的锁粒度尽量缩小,只保护需要保护的数据。

现代版本的 net/http 中已经对 Transport 进行了改进,分别使用了不同的 mutex 来保护 idleConn 和 altProto,以提高性能和代码的可维护性。

type Transport struct {
   idleMu       sync.Mutex
   idleConn     map[connectMethodKey][]*persistConn // most recently used at end

   altMu    sync.Mutex   // guards changing altProto only
   altProto atomic.Value // of nil or map[string]RoundTripper, key is URI scheme   
}

4.2 Mutex嵌入结构体中位置放置建议

将 Mutex 嵌入到结构体中,如果只需要保护其中一些数据,可以将 Mutex 放在需要控制的字段上面,然后使用空格将被保护字段和其他字段进行分隔。这样可以实现更细粒度的锁定,也能更清晰地表达每个字段需要被互斥保护的意图,代码更易于维护和理解。下面举一些实际的例子:

Server结构体中reqLock是用来保护freeReq字段,respLock用来保护freeResp字段,都是将mutex放在被保护字段的上面

//net/rpc server.go
type Server struct {
   serviceMap sync.Map   // map[string]*service
   reqLock    sync.Mutex // protects freeReq
   freeReq    *Request
   respLock   sync.Mutex // protects freeResp
   freeResp   *Response
}

在Transport结构体中,idleMu锁会保护closeIdle等一系列字段,此时将锁放在被保护字段的最上面,然后用空格将被idleMu锁保护的字段和其他字段分隔开来。 实现更细粒度的锁定,也能更清晰地表达每个字段需要被互斥保护的意图。

// net/http transport.go
type Transport struct {
   idleMu       sync.Mutex
   closeIdle    bool                                // user has requested to close all idle conns
   idleConn     map[connectMethodKey][]*persistConn // most recently used at end
   idleConnWait map[connectMethodKey]wantConnQueue  // waiting getConns
   idleLRU      connLRU

   reqMu       sync.Mutex
   reqCanceler map[cancelKey]func(error)

   altMu    sync.Mutex   // guards changing altProto only
   altProto atomic.Value // of nil or map[string]RoundTripper, key is URI scheme

   connsPerHostMu   sync.Mutex
   connsPerHost     map[connectMethodKey]int
   connsPerHostWait map[connectMethodKey]wantConnQueue // waiting getConns
}

4.3 尽量减小锁的作用范围

在一个代码段里,尽量减小锁的作用范围可以提高并发性能,减少锁的等待时间,从而减少系统资源的浪费。

锁的作用范围越大,那么就有越多的代码需要等待锁,这样就会降低并发性能。因此,在编写代码时,应该尽可能减小锁的作用范围,只在需要保护的临界区内加锁。

如果锁的作用范围是整个函数,使用 defer 语句来释放锁是一种常见的做法,可以避免忘记手动释放锁而导致的死锁等问题。

func (t *Transport) CloseIdleConnections() {
   t.lk.Lock()
   defer t.lk.Unlock()
   if t.idleConn == nil {
      return
   }
   for _, conns := range t.idleConn {
      for _, pconn := range conns {
         pconn.close()
      }
   }
   t.idleConn = nil
}

在使用锁时,注意避免在锁内执行长时间运行的代码或者IO操作,因为这样会阻塞锁的使用,导致锁的等待时间变长。如果确实需要在锁内执行长时间运行的代码或者IO操作,可以考虑将锁释放,让其他代码先执行,等待操作完成后再重新获取锁, 比如下面代码示例

// net/http/httputil persist.go
func (cc *ClientConn) Read(req *http.Request) (resp *http.Response, err error) {
   // Retrieve the pipeline ID of this request/response pair
   cc.mu.Lock()
   id, ok := cc.pipereq[req]
   delete(cc.pipereq, req)
   if !ok {
      cc.mu.Unlock()
      return nil, ErrPipeline
   }
   cc.mu.Unlock()
    
    // xxx 省略掉一些中间逻辑

   // 从http连接中读取http响应数据, 这个IO操作,先解锁
   resp, err = http.ReadResponse(r, req)
   // 网络IO操作结束,再继续读取
   
   cc.mu.Lock()
   defer cc.mu.Unlock()
   if err != nil {
      cc.re = err
      return resp, err
   }
   cc.lastbody = resp.Body

   cc.nread++

   if resp.Close {
      cc.re = ErrPersistEOF // don't send any more requests
      return resp, cc.re
   }
   return resp, err
}

5.总结

在并发编程中,Mutex是一种常见的同步机制,用来保护共享资源。为了提高并发性能,我们需要尽可能缩小Mutex的锁粒度,只保护需要保护的数据,同时在一个代码段里,尽量减小锁的作用范围。如果锁的作用范围是整个函数,可以使用defer来在函数退出时解锁。当Mutex嵌入到结构体中时,我们可以将Mutex放到要控制的字段上面,并使用空格将字段进行分隔,以便只保护需要保护的数据。

热门相关:帝少的专属:小甜心,太缠人   豪门闪婚:帝少的神秘冷妻   仗剑高歌   照见星星的她   第一神算:纨绔大小姐